基于改进相似性度量的邻近传播聚类算法被引量：3

Affinity Propagation Clustering Algorithms Based on Improved Similarity Measure

下载PDF

导出

摘要邻近传播(Affinity Propagation,AP)聚类将数据集中所有数据点均视为潜在的聚类中心,并采用欧氏距离法计算输入相似度矩阵,导致其性能对变形十分敏感。针对这一缺陷,提出了采用两种不同的相似性度量方法来计算数据集中两个数据点之间的相似度。分别将明可夫斯基(Minkowski)和切比雪夫(Chebychev)相似性度量引入到AP聚类中,替换原有的欧氏距离度量来构建相似性矩阵。在UCI机器学习数据集上,利用Jaccard指数和Fowlkes-Mlowers对提出方法进行了量化评估。实验结果表明,基于明可夫斯基距离和切比雪夫距离的AP聚类方法在总体精度上优于现有的欧氏距离。 Affinity propagation(AP)clustering treats all data points in the dataset as potential cluster centers,and uses the Euclidean distance method to calculate the input similarity matrix,which results in its performance being very sensitive to deformation.In view of this defect,two different similarity measurement methods are proposed to calculate the similarity between two data points in the data set.Minkowski and Chebychev similarity measures are introduced into the AP cluster,respectively,and the original Euclidean distance measure is replaced to construct the similarity matrix.On the UCI machine learning data set,the proposed method is quantitatively evaluated using Jaccard index and Fowlkes-Mlowers.The experimental results show that the AP clustering method based on Minkowski distance and Chebyshev distance has better overall accuracy than the existing Euclidean distance.

作者温爱红徐草草 WEN Aihong;XU Caocao(Engineering and Technical College, Chengdu University of Technology, Leshan 614007, China)

机构地区成都理工大学工程技术学院

出处《微型电脑应用》 2020年第9期173-176,共4页 Microcomputer Applications

关键词数据聚类邻近传播算法欧氏距离相似性度量聚类中心 data clustering proximity propagation algorithm Euclidean distance similarity measure cluster center

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1谷瑞军,汪加才,陈耿,陈圣磊.面向大规模数据集的近邻传播聚类[J].计算机工程,2010,36(23):22-24. 被引量：8
2刘璐,靳少辉,焦李成,刘帅.采用流形近邻传播聚类的极化SAR图像分类[J].信号处理,2016,32(2):135-141. 被引量：4
3谢娟英,屈亚楠.密度峰值优化初始中心的K-medoids聚类算法[J].计算机科学与探索,2016,10(2):230-247. 被引量：27
4周润物,李智勇,陈少淼,陈京,李仁发.面向大数据处理的并行优化抽样聚类K-means算法[J].计算机应用,2016,36(2):311-315. 被引量：45
5董俊,王锁萍,熊范纶.可变相似性度量的近邻传播聚类[J].电子与信息学报,2010,32(3):509-514. 被引量：49
6罗恩韬,王国军,李超良.大数据环境中多维数据去重的聚类算法研究[J].小型微型计算机系统,2016,37(3):438-442. 被引量：19

二级参考文献82

1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
2张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
3Frey B J and Dueck D. Clustering by passing messages between data points. Science, 2007, 315(5814): 972-976. 被引量：1
4Givoni I E and Frey B J. A binary variable model for affinity propagation. Neural Computation, 2009, 21(6): 1589-1600. 被引量：1
5Jia Sen, Qian Yun-tao, and Ji Zhen, Band hyperspectral imagery using affinity. Proceedings of the 2008 Digital Image Techniques and Applications, Canberra, ACT selection for Propagation. Computing: 1-3.12.2008:137-141. 被引量：1
6Gang Li, Lei brain MR International (ISCAS 2009) Guo, and Liu Tian-ming, et at. Grouping of images via affinity propagation. IEEE Symposium on Circuits and Systems, 2009 Taipei, Taiwan, 5.24. 2009: 2425-2428. 被引量：1
7Dueck D, Frey B J, and Jojic N, et al. Constructing treatment portfolios using affinity propagation[C]. Proceedings of 12th Annual International Conference, RECOMB 2008. Singapore. 3.30-4.2, 2008: 360-371. 被引量：1
8Leone M, Sumedha, and Weigt M. Clustering by soft-constraint affinity propagation: applications to gene- expression data. Bioinformatics, 2007, 23(20): 2708-2715. 被引量：1
9Alexander Hinneburg and Daniel A Keim. A general approach to clustering in large databases with noise. Knowledge and Information Systems, 2003, 5(4): 387-415. 被引量：1
10Little M A, McSharry P E, Hunter E J, and Lorraine O. Suitability of dysphonia measurements for telemonitoring of Parkinson's disease. IEEE Transactions on Biomedical Engineering, 2009, 56(4): 1015-1022. 被引量：1

共引文献141

1陈西江,安庆,班亚,王德欣,李坤,刘海鹏.融合高斯核及指数函数聚类的点云目标物提取[J].应用科学学报,2022,40(3):411-422.
2常瑞花.基于密集度量元的近邻传播聚类算法[J].微电子学与计算机,2015,32(5):1-5. 被引量：1
3李雪梅,王立宏,宋宜斌.一种混合约束的半监督聚类算法[J].模式识别与人工智能,2011,24(3):452-456. 被引量：2
4刘晓勇,付辉.一种快速AP聚类算法[J].山东大学学报（工学版）,2011,41(4):20-23. 被引量：20
5许晓丽,卢志茂,张格森,李纯,张琦.改进近邻传播聚类的彩色图像分割[J].计算机辅助设计与图形学学报,2012,24(4):514-519. 被引量：27
6张友新,王立宏.两阶段近邻传播半监督聚类算法[J].山东大学学报（工学版）,2012,42(2):18-22. 被引量：1
7付迎丁,兰巨龙.基于核自适应的近邻传播聚类算法[J].计算机应用研究,2012,29(5):1644-1647. 被引量：9
8李坤,黄开枝,鲁国英.部分信道状态信息下簇规模均匀的基站群快速分簇方案[J].计算机应用,2012,32(7):1827-1830. 被引量：1
9邢艳,周勇.基于互近邻一致性的近邻传播算法[J].计算机应用研究,2012,29(7):2524-2526. 被引量：9
10卢志茂,李纯,张琦.近邻传播的文本聚类集成谱算法[J].哈尔滨工程大学学报,2012,33(7):899-905. 被引量：9

同被引文献33

1刘振刚.度量学习在图形图像分类工作中的应用[J].计算机产品与流通,2020,0(3):196-196. 被引量：1
2石木耀,邢廷炎,张楠,蒋文杰.利用ArcEngine数据导入的方法[J].电脑编程技巧与维护,2009(4):26-28. 被引量：1
3巩秀兰.浅析GPS定位仪两种判读方法在天然林保护工程中的应用[J].科学之友（中）,2010(8):17-18. 被引量：1
4李杨,郝志峰,温雯,谢光强.差分隐私保护k-means聚类方法研究[J].计算机科学,2013,40(3):287-290. 被引量：48
5马文萍,黄媛媛,李豪,李晓婷,焦李成.基于粗糙集与差分免疫模糊聚类算法的图像分割[J].软件学报,2014,25(11):2675-2689. 被引量：33
6王履华,孙在宏,彭英,丁远.不动产登记信息数据整合及管理基础平台建设研究[J].地理信息世界,2014,21(4):76-82. 被引量：110
7吴玉炜,毛金明,周智明,许广军.不动产登记数据整合技术要点分析研究[J].科技创新导报,2016,13(10):99-100. 被引量：27
8古凌岚,彭利民.基于相对密度和流形上k近邻的聚类算法[J].计算机科学,2016,43(12):213-217. 被引量：2
9齐超.ArcGIS与AutoCAD地理空间数据共享方法研究[J].黑龙江科技信息,2016(36):170-170. 被引量：2
10孟晨晨,肖建于,罗兰.基于相似系数和Jaccard系数矩阵的证据冲突度量方法[J].重庆邮电大学学报（自然科学版）,2017,29(3):421-426. 被引量：6

引证文献3

1龙北平,吴家杰,郑勤华,孙立恒,刘锟铭.一种基于权重相似性模型的不动产数据整合方法[J].测绘通报,2021(6):122-126. 被引量：5
2刘佳伟,唐锦萍.基于K近邻链式相似性度量的聚类算法[J].计算机仿真,2023,40(8):382-388. 被引量：1
3张译,魏永瑜,马燕,冶秀兰,马元明.基于最邻近算法的数据中台内生性数据安全交互系统[J].电子设计工程,2024,32(8):121-124.

二级引证文献6

1康艳丽.基于无人机倾斜摄影和三维GIS技术的不动产测绘空间信息数据整合方法[J].资源导刊,2023(14):41-43.
2张洁玲.不动产登记空间数据库轮廓体更新方法[J].测绘与空间地理信息,2023,46(8):135-138.
3李治明,李涛,贾胜韬.不动产存量数据一体化整合方法研究[J].测绘与空间地理信息,2023,46(9):68-70. 被引量：1
4薛生,郑晓亮,袁亮,来文豪,张玉婷.基于机器学习的煤与瓦斯突出预测研究进展及展望[J].煤炭学报,2024,49(2):664-694.
5曾秀芬,谢灶芳,贾振涛.移动端不动产权籍调查系统设计应用[J].北京测绘,2023,37(11):1519-1524.
6卢皓天.ArcObject的智慧电厂一体化数据整合技术应用[J].粘接,2024,51(7):173-176.

1Mohamed El-Gamel,W. El-bashbashy,Atallah El-Shenawy.Numerical Solutions for the Time-Dependent Emden-Fowler-Type Equations by B-Spline Method[J].Applied Mathematics,2014,5(4):593-600.
2夏火松,孙泽林.基于自编码器和集成学习的半监督异常检测算法[J].计算机工程与科学,2020,42(8):1440-1447. 被引量：7
3杨林,罗淼,何邦财,唐孝国,陈兵.Orlicz-Aleksandrov体的混合体积[J].西南师范大学学报（自然科学版）,2020,45(8):25-28. 被引量：3
4徐岩柏,景运革.分布决策信息系统增量属性约简算法[J].微电子学与计算机,2020,37(9):31-36. 被引量：1
5高学东,王艾.基于企业网络舆情的客户满意度分析及管理方法[J].运筹与管理,2020,29(7):232-239. 被引量：6
6裴悦琨,叶家敏,姜艳超,连明月,韩心新,谷宇.基于机器视觉的樱桃形状及大小检测技术[J].食品工业,2020,41(8):199-202. 被引量：10
7张士进,张胜,田纪彪,吴志强,戴维凯.基于深度编码器的复杂网络社区发现算法[J].计算机工程与科学,2020,42(9):1640-1648. 被引量：3
8陈宇,王哲斐.基于分段仿射传播聚类的小电流接地选线法[J].湖北电力,2020,44(2):13-19. 被引量：2
9聂英豪,程耿东,李征.预测复合材料有效性质的聚类有限元分析及相互作用矩阵性质研究[J].大连理工大学学报,2020,60(5):441-455. 被引量：4
10裴炜旻.基于粗糙集的医院智能仪器数据库安全访问方法[J].自动化与仪器仪表,2020(4):175-178.

微型电脑应用

2020年第9期

浏览历史

内容加载中请稍等...

基于改进相似性度量的邻近传播聚类算法被引量：3

参考文献6

二级参考文献82

共引文献141

同被引文献33

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于改进相似性度量的邻近传播聚类算法 被引量：3

参考文献6

二级参考文献82

共引文献141

同被引文献33

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于改进相似性度量的邻近传播聚类算法被引量：3