摘要
聚类分析是数据挖掘中的重要研究之一,其算法的好坏直接影响到聚类效果。本文首先论述了经典的K-means聚类算法,然后分析讨论了K-means聚类算法对K值的选择,初始聚类中心的选择及对噪声与孤立点数据敏感等方面的不足,并利用了基于距离算法的孤立点剔除理论,来消除噪声和孤立点等数据对K-means聚类质量的影响,最后通过实验证明,改进后的K-means聚类算法更好的提高了聚类质量。
出处
《福建电脑》
2016年第5期1-2,5,共3页
Journal of Fujian Computer
基金
国家科技计划课题(2011BAD21B03)资助