基于改进的近邻传播聚类算法的Gap统计研究被引量：3

Study on Gap Statistic Based on Modified Affinity Propagation Clustering

下载PDF

导出

摘要由于K-means算法初始聚类中心的选取具有随机性,聚类结果可能不稳定,导致Gap统计估计的聚类数也可能不稳定。针对这些不足,提出一种改进的近邻传播算法-mAP。该算法考察数据的全局分布特性,不同的点赋予不同的P值。在Gap统计中用mAP算法代替K-means算法,提出基于mAP的Gap统计mAPGap。mAP能在较短的时间内得到较好的聚类效果,而且不需要预先设定初始聚类中心,聚类结果更稳定。实验结果表明,mAPGap在估计聚类数的稳定性和聚类精度上都优于原Gap。 Due to the randomness of choosing the initial clustering of K-means method, it may cause the instability of clustering results and then lead to that of clustering numbers which are estimated by Gap statistic. Taking consideration of those disadvantages, an modified AP clustering （mAP） is presented which utilizes the global distribution to give different P to different points, mAP method is put forward to substitute the K -means in Gap statistic named mAPGap, mAP method has more stable clustering center because the initial clustering center and numbers are not needed in advance and it can get better clustering in short time. The experimental results demonstrate mAPGap is superior to Gap in clustering stability and accuracy.

作者唐丹张正军王俐莉

机构地区南京理工大学理学院统计与金融数学系海军指挥学院科研部

出处《计算机技术与发展》 2017年第1期182-185,共4页 Computer Technology and Development

基金全国统计科学研究计划重点项目(2013LZ45)

关键词聚类分析近邻传播聚类偏向参数 K-MEANS算法 GAP统计 cluster analysis affinity propagation clustering preference K -means algorithm Gap statistic

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1刘倩..基于GS方法的图像分割估计数的多信息动态研究[D].南京理工大学,2013:
2陆琴琴..基于矩Gap统计的图像分割方法[D].南京理工大学,2014:
3冯晓磊,于洪涛.密度不敏感的近邻传播聚类算法研究[J].计算机工程,2012,38(2):159-162. 被引量：7
4邢艳,周勇.基于互近邻一致性的近邻传播算法[J].计算机应用研究,2012,29(7):2524-2526. 被引量：9
5段丽莉..改进的近邻传播算法及其在图像处理中的应用[D].西安电子科技大学,2014:
6邢长征,刘剑.基于近邻传播与密度相融合的进化数据流聚类算法[J].计算机应用,2015,35(7):1927-1932. 被引量：34
7肖宇,于剑.基于近邻传播算法的半监督聚类[J].软件学报,2008,19(11):2803-2813. 被引量：165
8童波..基于MFGS方法图像最佳分割数的研究[D].南京理工大学,2011:
9黄陈蓉,张正军,吴慧中.图像边缘检测的多尺度灰度Gap统计模型[J].中国图象图形学报,2005,10(8):1018-1023. 被引量：4
10冯予,陈萍编著..概率论与数理统计[M].北京:国防工业出版社,2015:250.

二级参考文献38

1Gelbard R, Goldman O, Spiegler I. Investigating Diversity of Clustering Methods: An Empirical Comparison[J]. Data & Knowledge Engineering, 2007, 63(1): 155-166. 被引量：1
2Frey B J, Dueck D. Clustering by Passing Messages Between Data Points[J]. Science, 2007, 315(5814): 972-976. 被引量：1
3Thedoridis S, Koutroumbas K. Pattern Recognition[M]. 3rd ed. Beijing, China: Publishing House of Electronics Industry, 2010. 被引量：1
4Rudin L, Osher S, Fateml E. Nonlinear total variation based noise removal algorithm [A]. In: Proceedings of the llth Annual International Conference of the Center for Nonlinear Studies on Experimental Mathematics[C]. Los Alamos, 1992 : 259 ~ 268. 被引量：1
5Meyer Yves. Oscillating Patterns in Image Processing and Nonlinear Evolution Equations [M]. Boston: American Mathematical Society,2001. 被引量：1
6Richardson W H. Bayesian-based iterative method of image restoration[J]. Journal of Optical Society of America, 1972, 62( 1 ) :55 ~59. 被引量：1
7Cross G, Jaln A. Markov random field texture models [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1983,5(1) :25 ~39. 被引量：1
8Tibshirani R, Walther G, Hastie T. Estimating the Number of Clusters in a Dataset via the Gap Statistic [R]. SN (2000) JRSSB,Palo Alto: Stanford University, 2000. 被引量：1
9王玲,薄列峰,焦李成.密度敏感的半监督谱聚类[J].软件学报,2007,18(10):2412-2422. 被引量：94
10ZHOU Yong,XING Yan. Summary of affinity propagation[J].Current Advances in Materials and Processes,2011.811-816. 被引量：1

共引文献206

1常瑞花.基于密集度量元的近邻传播聚类算法[J].微电子学与计算机,2015,32(5):1-5. 被引量：1
2张浩,蔡晋辉,周泽魁.基于证据理论的多尺度间隙统计边缘检测[J].光电子．激光,2007,18(8):988-991.
3李昆仑,曹铮,曹丽苹,张超,刘明.半监督聚类的若干新进展[J].模式识别与人工智能,2009,22(5):735-742. 被引量：50
4梁吉业,高嘉伟,常瑜.半监督学习研究进展[J].山西大学学报（自然科学版）,2009,32(4):528-534. 被引量：32
5郝建柏,陈贤富,黄双福,杨俊.一种基于模糊近邻标签传递的半监督分类算法[J].微电子学与计算机,2010,27(2):30-33. 被引量：6
6郭景峰,马鑫,代军丽.基于文本—链接模型和近邻传播算法的网页聚类[J].计算机应用研究,2010,27(4):1255-1258. 被引量：3
7何海江,何文德,刘华富.集成最近邻规则的半监督顺序回归算法[J].计算机应用,2010,30(4):1022-1025. 被引量：1
8潘章明.半监督的自动聚类[J].计算机应用,2010,30(10):2614-2617. 被引量：2
9吴东洋,业宁,苏小青.基于灰度共生矩阵和聚类方法的木材缺陷识别[J].计算机与数字工程,2010,38(11):38-41. 被引量：12
10谷瑞军,汪加才,陈耿,陈圣磊.面向大规模数据集的近邻传播聚类[J].计算机工程,2010,36(23):22-24. 被引量：8

同被引文献25

1吕锋,张炜玮.4种序列模式挖掘算法的特性研究[J].武汉理工大学学报,2006,28(2):57-60. 被引量：14
2宋代立,张洁.蚁群算法求解混合流水车间分批调度问题[J].计算机集成制造系统,2013,19(7):1640-1647. 被引量：43
3张其亮,陈永生.求解双向无等待混合流水车间调度问题的粒子群优化算法[J].计算机集成制造系统,2013,19(10):2503-2509. 被引量：8
4姚锡凡,于淼,陈勇,项子灿.制造物联的内涵、体系结构和关键技术[J].计算机集成制造系统,2014,20(1):1-10. 被引量：72
5喻金平,郑杰,梅宏标.基于改进人工蜂群算法的K均值聚类算法[J].计算机应用,2014,34(4):1065-1069. 被引量：50
6郝晓丽,张靖.基于改进自适应聚类算法的RBF神经网络分类器设计与实现[J].计算机科学,2014,41(6):260-263. 被引量：21
7崔维伟,陆志强,潘尔顺.基于多目标优化的生产调度与设备维护集成研究[J].计算机集成制造系统,2014,20(6):1398-1404. 被引量：37
8夏磊,张乐君,国林,张勇实,张健沛,杨静.节点相似度标签传播在社会网络中的应用研究[J].计算机工程与应用,2014,50(14):103-109. 被引量：4
9王旭仁,李娜,何发镁,王彦丽,宋蓓.基于改进聚类算法的网络舆情分析系统研究[J].情报学报,2014,33(5):530-537. 被引量：14
10刘明周,王小巧,马靖,张铭鑫,刘从虎.基于互信息和博弈论的复杂机械产品装配质量控制阈在线优化方法及应用[J].计算机集成制造系统,2014,20(11):2798-2807. 被引量：7

引证文献3

1桂春,黄旺星.基于改进的标签传播算法的网络聚类方法[J].吉林大学学报（工学版）,2018,48(5):1600-1605.
2潘伟.基于大数据的智慧工厂制造优化技术研究[J].计算机技术与发展,2019,29(1):202-205. 被引量：17
3高晋洲,朱晓娟,张天浩,王健,程璐.智能工厂中边缘服务器的部署方法研究[J].湖北理工学院学报,2022,38(3):17-22. 被引量：1

二级引证文献18

1刘晓腾,张春明,徐传贵,曹斌,刘彤彤.样试及小批量生产的智能排产系统建设[J].电气时代,2023(S02):49-53.
2唐毅,常建,岳明明,高雪.基于大数据的智慧工厂技术框架[J].通信电源技术,2019,36(3):183-185. 被引量：7
3林厦.BIM技术在选煤厂设计中的应用探讨[J].煤炭加工与综合利用,2019(3):29-32. 被引量：8
4俞懿展.基于数字经济驱动两化融合创建智慧工厂的探索与研究——以钢铁企业为例[J].环渤海经济瞭望,2019,33(12):53-54. 被引量：4
5杨磊,冯茜,袁明锋.军工企业信息系统大数据挖掘实例分析[J].中国管理信息化,2020,23(13):108-110. 被引量：1
6白辛雨,杨朝雯,杨国朝,王炎彬.基于大数据的智慧工厂制造优化技术[J].电子技术与软件工程,2020(12):137-139. 被引量：1
7侯建,王礼沅.航空装备维修保障模式数字化转型[J].测控技术,2020,39(12):16-21. 被引量：5
8袁明锋,田跃军,杨磊,李通,孙先海,孙宏鹏.基于物联网智能车间的信息化研究[J].新技术新工艺,2021(3):1-4. 被引量：2
9王学军,韩清林,徐彦雷,桂彬.烟草企业粉尘防爆预警系统设计与应用[J].中国新技术新产品,2021(7):146-148.
10刘超,李瑞.基于大数据的智慧工厂技术[J].科学大众（科技创新）,2021(8):106-107.

1谢文斌,童楠,王忠秋,贾官洪,陈维奇,符强.基于粒子群的近邻传播算法[J].计算机系统应用,2014,23(3):103-107. 被引量：6
2赵淑娟,王江晴,孙阳光.基于改进仿射传播聚类的图像分割算法研究[J].软件导刊,2017,16(3):18-21.
3张正军,李建军,刘力维.标准化水平Gap统计量的零件图像分割数估计[J].中国制造业信息化（学术版）,2007,36(10):146-149. 被引量：2
4黄陈蓉,张正军,吴慧中.图像多尺度秩和统计间隙的模糊边缘检测模型[J].计算机研究与发展,2005,42(12):2111-2117. 被引量：2
5张友新,王立宏.两阶段近邻传播半监督聚类算法[J].山东大学学报（工学版）,2012,42(2):18-22. 被引量：1
6王平禄,董昱威.浅谈聚类算法在图像分割中的应用[J].无线互联科技,2013,10(7):172-172. 被引量：1
7钱丽丽,施鹏飞.近邻传播算法在非监督图像聚类中的应用[J].微型电脑应用,2011(2):34-36. 被引量：2
8周世兵,徐振源,唐旭清.一种基于近邻传播算法的最佳聚类数确定方法[J].控制与决策,2011,26(8):1147-1152. 被引量：23
9周世兵,徐振源,唐旭清.基于近邻传播算法的最佳聚类数确定方法比较研究[J].计算机科学,2011,38(2):225-228. 被引量：30
10黄陈蓉,张正军,吴慧中.图像边缘检测的多尺度Gap统计方法[J].计算机辅助设计与图形学学报,2005,17(6):1268-1272. 被引量：4

计算机技术与发展

2017年第1期

浏览历史

内容加载中请稍等...

基于改进的近邻传播聚类算法的Gap统计研究被引量：3

参考文献10

二级参考文献38

共引文献206

同被引文献25

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于改进的近邻传播聚类算法的Gap统计研究 被引量：3

参考文献10

二级参考文献38

共引文献206

同被引文献25

引证文献3

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于改进的近邻传播聚类算法的Gap统计研究被引量：3