-
题名噪音特征对聚类内部有效性的影响
被引量:6
- 1
-
-
作者
杨虎
付宇
范丹
-
机构
中央财经大学信息学院
中国人民大学统计学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第7期22-30,52,共10页
-
基金
国家自然科学基金青年科学基金项目(71701223)资助
-
文摘
聚类内部有效性指标是在未知样本真实分类情况下用于评价聚类结果优劣、寻找最佳聚类个数的指标,是聚类分析研究中的重要内容。虽然已有大量的研究分析了聚类内部有效性指标的性能,且有研究结论表明某些内部有效性指标的性能良好,能够辅助聚类算法找到最佳聚类个数,但这些研究未考虑真实数据中的噪音特征对内部有效性指标的影响,研究结论可能会误导内部有效性指标的选取和应用。为此,选取了10种常用的内部有效性指标来研究噪音特征对内部有效性特征选择和聚类结果的影响。结果表明,数据中的噪音特征会影响内部有效性指标的性能,除KL指标、CH指标和CCC指标对噪音特征的反应相对不敏感外,其他内部有效性指标均对噪音特征敏感,且聚类结果的准确性会随着噪音的增强而降低。
-
关键词
内部有效性
噪音特征
聚类个数
聚类准确度
-
Keywords
Internal validation
Noisy features
Number of clusters
Clustering accuracy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-