最近最远得分的聚类性能评价指标被引量：8

A clustering evaluation index based on the nearest and furthest score

下载PDF

导出

摘要聚类算法是数据分析中广泛使用的方法之一,而类别数往往是决定聚类算法性能的关键。目前,大部分聚类算法需要预先给定类别数,在很多情况下,很难根据数据集的先验知识获得有效的类别数。因此,为了获得数据集的类别数,本文基于最近邻一致性和最远邻相异性的准则,提出了一种最近最远得分评价指标,并在此基础上提出了一种自动确定类别数的聚类算法。实验结果证明了所提评价指标在确定类别数时的有效性和可行性。 The clustering algorithm is one of the widely-used methods in data analysis. However ’ the number of clusters is essential to determine the performance of the clustering algorithm. At present ’ the number of clusters usually need to be specified in advance. In most cases ’ it is difficult to obtain the valid cluster number according to a priori knowledge of the dataset. To obtain the number of clusters automatically ’ a Nearest and Furthest Score （NFS） index was proposed based on the principles of the nearest neighbor consistency and the furthest neighbor difference. Moreover,an Automatic Clustering NFS （ACNFS） algorithm was also proposed’ which can determine the number of clusters automatically. The experimental results prove the index is reasonable and practicable to determine the cluster number.

作者冯柳伟常冬霞邓勇赵耀

机构地区北京交通大学信息科学研究所北京交通大学计算机与信息科学学院中国科学院软件研究所

出处《智能系统学报》 CSCD 北大核心 2017年第1期67-74,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金"重点"项目(61532005)

关键词最近邻一致性最远邻相异性 K-MEANS聚类算法评分机制评价指标层次聚类 the nearest neighbor consistency the furthest neighbor difference K-means clustering algorithm scoring mechanism evaluation index hierarchical clustering

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1刘恋,常冬霞,邓勇.动态小生境人工鱼群算法的图像分割[J].智能系统学报,2015,10(5):669-674. 被引量：3
2郑宏亮,徐本强,赵晓慧,邹丽.新的模糊聚类有效性指标[J].计算机应用,2014,34(8):2166-2169. 被引量：4
3岳士弘,黄媞,王鹏龙.基于矩阵特征值分析的模糊聚类有效性指标[J].天津大学学报（自然科学与工程技术版）,2014,47(8):689-696. 被引量：6
4卿铭,孙晓梅.一种新的聚类有效性函数:模糊划分的模糊熵[J].智能系统学报,2015,10(1):75-80. 被引量：4
5王开军,李健,张军英,过立新.聚类分析中类数估计方法的实验比较[J].计算机工程,2008,34(9):198-199. 被引量：24
6王勇,唐靖,饶勤菲,袁巢燕.高效率的K-means最佳聚类数确定算法[J].计算机应用,2014,34(5):1331-1335. 被引量：64
7周世兵,徐振源,唐旭清.K-means算法最佳聚类数确定方法[J].计算机应用,2010,30(8):1995-1998. 被引量：142
8周世兵..聚类分析中的最佳聚类数确定方法研究及应用[D].江南大学,2011:

二级参考文献92

1普运伟,金炜东,朱明,胡来招.核模糊C均值算法的聚类有效性研究[J].计算机科学,2007,34(2):207-210. 被引量：28
2范玉军,王冬冬,孙明明.改进的人工鱼群算法[J].重庆师范大学学报（自然科学版）,2007,24(3):23-26. 被引量：43
3胡春春,孟令奎,谢文君,周新忠.空间数据模糊聚类的有效性评价[J].武汉大学学报（信息科学版）,2007,32(8):740-743. 被引量：5
4CALINSKI R,HARABASZ J.A dendrite method for cluster analysis[J].Communications in Statistics,1974,3(1):1 -27. 被引量：1
5DAVIES D L,BOULDIN D W.A cluster separation measure[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1979,1(2):224-227. 被引量：1
6DUDOIT S,FRIDLYAND J.A prediction-based resampling method for estimating the number of clusters in a dataset[J].Genome Biology,2002,3(7):1-21. 被引量：1
7DIMITRIADOU E,DOLNICAR S,WEINGESSEL A.An examination of indexes for determining the number of cluster in binary data sets[J].Psychometrika,2002,67(1):137-160. 被引量：1
8KAPP A V,TIBSHIRANI R.Are clusters found in one dataset present in another dataset?[J].Biostatistics,2007,8(1):9-31. 被引量：1
9ROUSSEEUW P J.Silhouettes:a graphical aid to the interpretation and validation of cluster analysis[J].Journal of Computational and Applied Mathematics,1987,20(1):53 -65. 被引量：1
10DEMB(E)L(E) D,KASTNER P.Fuzzy C-means method for clustering microarray data[J].Bioinformatics,2003,19(8):973-980. 被引量：1

共引文献231

1黄仁,冯阿瑞.基于Ncut的自适应图像分割方法[J].土木建筑与环境工程,2013,35(S2):107-110. 被引量：2
2张新娟.一种基于改进粒子群算法的图像分类方法研究[J].自动化与仪器仪表,2016(7):163-164. 被引量：1
3何云,李辉,姚能坚,赵榕生.改进K-means算法实现移动通信行为特征分析[J].计算机技术与发展,2011,21(6):63-65.
4边鹏,赵妍,苏玉召.一种改进的K-means算法最佳聚类数确定方法[J].现代图书情报技术,2011(9):34-40. 被引量：12
5张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43
6宫峰勋,戴丽华.基于K-means聚类的多传感器航迹起始算法[J].中国电子商情（通信市场）,2011(6):340-346.
7李坦,杨洪耕,高云.智能电表家用负荷识别技术综述[J].供用电,2011,28(6):39-42. 被引量：9
8谢娟英,马箐,谢维信.一种确定最佳聚类数的新算法[J].陕西师范大学学报（自然科学版）,2012,40(1):13-18. 被引量：11
9谢娟英,郭文娟,谢维信,高新波.基于样本空间分布密度的改进次胜者受罚竞争学习算法[J].计算机应用,2012,32(3):638-642. 被引量：5
10于吉红,白晓明,郭宁.基于聚类技术的三维舰船模型特征库研究[J].应用光学,2012,33(2):260-264.

同被引文献76

1蒋盛益,徐雨明,陈溪辉.异常挖掘研究综述[J].衡阳师范学院学报,2004,25(3):63-66. 被引量：2
2王开军,张军英,李丹,张新娜,郭涛.自适应仿射传播聚类[J].自动化学报,2007,33(12):1242-1246. 被引量：144
3孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1070
4陈黎飞,姜青山,王声瑞.基于层次划分的最佳聚类数确定方法[J].软件学报,2008,19(1):62-72. 被引量：82
5王桂芝,王广亮.改进的快速DBSCAN算法[J].计算机应用,2009,29(9):2505-2508. 被引量：24
6付元元,任东.支持向量机中核函数及其参数选择研究[J].科技创新导报,2010,7(9):6-7. 被引量：19
7周世兵,徐振源,唐旭清.基于近邻传播算法的最佳聚类数确定方法比较研究[J].计算机科学,2011,38(2):225-228. 被引量：30
8董鹍,饶之帆,杨晓云,林劲畅,张鹏翔.几种塑料的拉曼光谱检测[J].塑料工业,2011,39(6):67-70. 被引量：58
9周世兵,徐振源,唐旭清.一种基于近邻传播算法的最佳聚类数确定方法[J].控制与决策,2011,26(8):1147-1152. 被引量：23
10熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究,2011,28(11):4188-4190. 被引量：86

引证文献8

1鲁春,杨会成,杨文斌,朱文博.结合光流法与最近邻算法的运动目标检测[J].四川理工学院学报（自然科学版）,2017,30(5):63-68. 被引量：2
2张梦成,刘兆辉,谭洪卫.基于改进FCM算法的校园空调冷负荷错峰研究[J].建筑热能通风空调,2018,37(3):10-15.
3卢建云,朱庆生,吴全旺.一种启发式确定聚类数方法[J].小型微型计算机系统,2018,39(7):1381-1385. 被引量：7
4邹臣嵩,杨宇.基于密度和最优聚类数的入侵检测方法[J].西南师范大学学报（自然科学版）,2018,43(12):91-99. 被引量：3
5张军超,蒋强荣.一种GMMHMM隐状态与高斯混合成份初始化算法[J].软件导刊,2019,18(1):81-85. 被引量：1
6邹臣嵩,段桂芹,欧阳明星,刘锋.基于改进近邻传播算法的聚类质量评价模型[J].西南师范大学学报（自然科学版）,2020,45(6):97-106. 被引量：4
7郭琦,姜红,吴克难,杨金颉,段斌,刘峰.基于差分拉曼光谱对一次性塑料杯盖的分类研究[J].中国塑料,2021,35(9):116-121. 被引量：1
8陈文龙,时宏伟.基于KD树改进的DBSCAN聚类算法[J].计算机系统应用,2022,31(2):305-310. 被引量：10

二级引证文献28

1刘永超,刘秀文,谢兴涛,栾鑫.基于激光雷达的港口环境海面目标检测[J].电子测量技术,2023,46(6):153-158. 被引量：1
2张莉曼,张向先,卢恒,张玲.知识直播平台付费用户群体画像研究[J].图书情报工作,2019,63(5):84-91. 被引量：21
3刘丛,陈倩倩,陈应霞.多距离聚类有效性指标研究[J].小型微型计算机系统,2019,40(10):2209-2214. 被引量：1
4宋怀波,吴頔华,阴旭强,姜波,何东健.基于Lucas-Kanade稀疏光流算法的奶牛呼吸行为检测[J].农业工程学报,2019,35(17):215-224. 被引量：14
5门耀华.光纤通信系统的异常入侵行为检测研究[J].激光杂志,2019,40(12):141-144. 被引量：2
6袁培森,杨承林,宋玉红,翟肇裕,徐焕良.基于Stacking集成学习的水稻表型组学实体分类研究[J].农业机械学报,2019,50(11):144-152. 被引量：22
7张莉曼,张向先,陶兴,卢恒.面向评论语义关系的学术APP服务需求聚合研究[J].情报理论与实践,2020,43(1):155-162. 被引量：11
8张莉曼,张向先,吴雅威,郭顺利.基于小数据的社交类学术App用户动态画像模型构建研究[J].图书情报工作,2020,64(5):50-59. 被引量：23
9刘锋,邹臣嵩,崔炜.大数据环境下基于K中心点优化算法的Web服务组合[J].计算机与现代化,2020(12):20-24. 被引量：1
10孙煜华,李情,张梦清.基于Spark框架的电力大数据服务技术[J].信息技术,2021,45(5):102-108. 被引量：2

1陈鹏.数据分类挖掘及分析系统的实现[J].中国科技博览,2009(21):251-252.
2刘晓颖,桂卫华.复杂过程的故障诊断技术[J].计算机工程与应用,2001,37(7):11-13. 被引量：5
3于红芸,姜涛,关键.SAR图像目标检测的互信息非负矩阵分解算法[J].中国图象图形学报,2011,16(1):129-134. 被引量：3
4王淑青,杨桦,刘辉.在线知识获得智能模糊控制器研究[J].计算机与现代化,2006(3):17-19.
5舒宁.一种遥感图象理解专家系统的设计[J].武测科技,1995(1):11-14. 被引量：3
6张凤明.多媒体在中学化学中的合理性应用研究[J].俪人（教师）,2014,0(23):94-94.
7王欢,王社国,袁玉锦.基于LOTUS DOMINO/NOTES的办公自动化技术新发展[J].华南金融电脑,2006,14(3):48-50. 被引量：2
8周春平.中职学校计算机实践教学探讨[J].软件（教育现代化）（电子版）,2014,4(13):160-160.
9胡灶福,闫军,陈大宏.型钢孔型智能CAD系统研究[J].华东冶金学院学报,1996,13(2):124-129.
10沈明霞,张瑞合,姬长英.农作物边缘提取方法研究[J].农业机械学报,2000,31(6):49-51. 被引量：11

智能系统学报

2017年第1期

浏览历史

内容加载中请稍等...

最近最远得分的聚类性能评价指标被引量：8

参考文献8

二级参考文献92

共引文献231

同被引文献76

引证文献8

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

最近最远得分的聚类性能评价指标 被引量：8

参考文献8

二级参考文献92

共引文献231

同被引文献76

引证文献8

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

最近最远得分的聚类性能评价指标被引量：8