K-means算法初始聚类中心选择的优化被引量：50

Optimization to K-means initial cluster centers

下载PDF

导出

摘要针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 To solve this problems that the traditional K-means algorithm has sensitivity to the initial cluster centers, a new improved K-means algorithm is proposed. The algorithm builds minimum spanning tree and then splits it to get K initial clusters and the relevant initial cluster centers. The initial cluster centers are found to be very closed to the desired cluster centers for iterative clustering algorithms. Theory analysis and experimental results demonstrate that the improved algorithms can enhance the clus- tering performance, get stable clustering in a higher accuracy.

作者冯波郝文宁陈刚占栋辉

机构地区解放军理工大学工程兵工程学院

出处《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页 Computer Engineering and Applications

关键词 K—means算法聚类初始聚类中心 TDKM算法 K-means algorithm clustering initial clustering centers TDKM algorithm

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
2王玲,薄列峰,焦李成.密度敏感的谱聚类[J].电子学报,2007,35(8):1577-1581. 被引量：61
3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：192
4冯超..K-means聚类算法的研究[D].大连理工大学,2007:
5汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：140
6赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
7汪军,王传玉,周鸣争.半监督的改进K-均值聚类算法[J].计算机工程与应用,2009,45(28):137-139. 被引量：13
8孙雪,李昆仑,胡夕坤,赵瑞.基于半监督K-means的K值全局寻优算法[J].北京交通大学学报,2009,33(6):106-109. 被引量：11
9毛韶阳,李肯立.优化K-means初始聚类中心研究[J].计算机工程与应用,2007,43(22):179-181. 被引量：26

二级参考文献79

1荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
2袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
3李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
4李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
5钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
6Guha S,Rastogi R,Shim K.Cure:an efficient clustering algorithm for large database[C]//Proc of ACM-SIGMOND lnt Conf Managemerit on Data, Seattle, Washington, 1998 . 73-84. 被引量：1
7Ester M,Kriegel H P,Sander J.A density-based algorithm tier discovering chlsters in large spatial databases with noise[C]//Proc 2nd Int Conf on Knowledge Discovery and Data Mining.Portland, 1999.20:226-231. 被引量：1
8Han J, Kamber M. Data Mining Concepts and Techniques. Orlando, USA: Morgan Kaufmann Publishers, 2001 被引量：1
9Huang J Z, Ng M K, Rang Hongqiang, et al. Automated Variable Weighting in K-means Type Clustering. IEEE Trans on Pattern Analysis and Machine Intelligence, 2005, 27 (5) : 657 - 668 被引量：1
10Dhillon I S, Guan Yuqiang, Kogan J. Refining Clusters in High Dimensional Text Data//Proc of the 2nd SIAM Workshop on Clustering High Dimensional Data. Arlington, USA, 2002 : 59 - 66 被引量：1

共引文献473

1段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
2刘文一,孙伟,朱良明,赵志博.舰载飞行器打击水面舰艇编队队形识别和目标选择方法[J].兵器装备工程学报,2020,41(2):85-89. 被引量：11
3刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：23
4楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
5王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
6韩丽苹,孟海东,李海荣.聚类算法在矿产资源与经济发展关系研究中的应用[J].煤炭技术,2015,34(5):290-292.
7陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
8李桃迎,陈燕.一种改进FCM的快速优化算法及其应用[J].大连海事大学学报,2006,32(4):23-27. 被引量：4
9郭海湘,诸克军,李玥,王得运.软计算与硬计算融合的中国石油需求预测[J].中国地质大学学报（社会科学版）,2007,7(6):24-28. 被引量：2
10孙薇,张省.基于半监督支持向量机的供电企业安全性评价[J].电气应用,2008,27(1):57-60. 被引量：1

同被引文献451

1石蓉,李永毅,王开艳,张磊,贾嵘,郎锐.新电改背景下基于数据包络分析的电网投资有效性研究与应用[J].电网与清洁能源,2019,35(2):9-14. 被引量：13
2杨青,孙佰聪,朱美臣,杨青川,刘念.基于小波包熵和聚类分析的滚动轴承故障诊断方法[J].南京理工大学学报,2013,37(4):517-523. 被引量：13
3胡雄伟,张宝林,李抵飞.大数据研究与应用综述(上)[J].标准科学,2013(9):29-34. 被引量：44
4程林辉,钟珞.求解多峰函数优化问题的并行免疫遗传算法[J].微电子学与计算机,2015,32(5):117-121. 被引量：10
5杨燕,靳蕃,Mohamed Kamel.一种基于蚁群算法的聚类组合方法[J].铁道学报,2004,26(4):64-69. 被引量：39
6宋艳,梁静国.基于模糊聚类的客户分类应用研究[J].物流科技,2005,28(1):26-28. 被引量：9
7赵志宇,邵诚,于云满.基于小波变换的滚动轴承故障诊断专家系统的研究[J].机械设计与研究,2005,21(1):50-52. 被引量：18
8郑粉莉.细沟侵蚀量测算方法的探讨[J].水土保持通报,1989,9(4):41-45. 被引量：30
9熊锐,蒋晓亚.层次分析法在多目标决策中的应用[J].南京航空航天大学学报,1994,26(2):283-288. 被引量：37
10郑粉莉,唐克丽,白红英.标准小区和大型坡面径流场径流泥沙监测方法分析[J].人民黄河,1994,17(7):19-22. 被引量：11

引证文献50

1李蓉,周维柏.基于改进的K-Means算法入侵检测框架[J].实验室研究与探索,2014,33(3):110-114. 被引量：3
2刘芝怡,陈功.基于改进K-means算法的RFAT客户细分研究[J].南京理工大学学报,2014,38(4):531-536. 被引量：17
3袁周米琪,周坚华.自适应确定K-means算法的聚类数：以遥感图像聚类为例[J].华东师范大学学报（自然科学版）,2014(6):73-80. 被引量：3
4夏同胜,黄雨辰.改进的k-means算法在电子商务目标客户细分中的应用研究[J].吉林工程技术师范学院学报,2015,31(3):58-60. 被引量：1
5罗倩.K-means聚类中心的鲁棒优化算法[J].计算机工程与设计,2015,36(9):2395-2400. 被引量：7
6刘敏,韩宾,郭有倩.一种改进的基于K-means的信息聚类算法研究[J].信息通信,2015,28(9):35-36. 被引量：1
7朱晔,冯万兴,郭钧天,李雪皎,刘娟.一种改进的k-中心点聚类算法及在雷暴聚类中的应用[J].武汉大学学报（理学版）,2015,61(5):497-502. 被引量：10
8张小川,严杰,朱常鹏.聚类算法在市政绩效评估中的应用[J].软件导刊,2015,14(11):48-51. 被引量：2
9李振,贾瑞玉.一种改进的K-means蚁群聚类算法[J].计算机技术与发展,2015,25(12):28-31. 被引量：11
10任旭瑞,周坚华.输入特征向量的自适应优化——以遥感图像K-均值聚类为例[J].遥感信息,2016,31(2):6-12. 被引量：2

二级引证文献388

1周斌,苏鹏,高鹏.基于改进YOLOv3算法的挖掘机检测方法[J].数字制造科学,2022(2):141-145. 被引量：2
2张明宇,齐瑞锋,王强,刘峰.喷杆机械臂障碍物检测系统设计与性能测试[J].中国农业信息,2021,33(2):49-56. 被引量：2
3赵源,王越,胡华.基于POI-K-means地铁车站聚类方法研究[J].智能计算机与应用,2022,12(5):114-118. 被引量：7
4李飞谷,张玉香,朱峰波,温良涛.提高地方煤质数据库应用价值的途径[J].中国科技纵横,2018,0(17):167-168. 被引量：1
5何柱裕,王丽.迟发性运动障碍的药物治疗[J].中国药师,2000,3(2):111-111. 被引量：1
6李晓庆,唐昊,司加胜,苗刚中.面向混合属性数据集的改进半监督FCM聚类方法[J].自动化学报,2018,44(12):2259-2268. 被引量：8
7于跃,李雷鸣.加油站客户价值分类与精准营销策略——基于改进RFAT模型的定价模式分析[J].价格理论与实践,2018(11):158-161. 被引量：4
8林明辉.基于PCA和BP网络的线上零售客户价值细分研究[J].长春师范大学学报,2015,34(12):167-171. 被引量：1
9吴卫江,周静,李国和.一种基于节点重要度的社团划分算法[J].中南民族大学学报（自然科学版）,2016,35(1):119-122. 被引量：1
10任旭瑞,周坚华.输入特征向量的自适应优化——以遥感图像K-均值聚类为例[J].遥感信息,2016,31(2):6-12. 被引量：2

1曹洪武,王振磊,姚娜,姚江河.基于SLIC和多尺度显著性的红枣图像分割算法[J].江苏农业科学,2016,44(3):455-457.
2孙巍,郭敏.基于SLIC与条件随机场的图像分割算法[J].计算机应用研究,2015,32(12):3817-3820. 被引量：14
3赵伟,林楠,韩英,张洪涛.一种改进的K-means聚类的协同过滤算法[J].安徽大学学报（自然科学版）,2016,40(2):32-36. 被引量：14
4赵军,徐晓燕.基于GraphX的分布式幂迭代聚类[J].计算机应用,2016,36(10):2710-2714. 被引量：3
5穆肇南.海量数据信息中的迭代聚类过程的改进研究[J].科技通报,2016,32(4):152-155. 被引量：4
6曹洪武,周保平,姚江河.基于PSO和视觉显著性的棉花图像分割算法[J].江苏农业科学,2016,44(2):430-433. 被引量：2
7邵辰琳,杨卫平,张志龙.基于简单线性迭代聚类超像素的meanshift跟踪[J].应用光学,2017,38(2):193-199. 被引量：5
8蔡强,刘亚奇,曹健,毛典辉,李海生.基于SLIC与Delaunay图割的交互式图像分割算法[J].计算机科学与探索,2015,9(4):482-490. 被引量：1
9韩海.基于K-means算法的RGB图像色彩聚类[J].江汉大学学报（自然科学版）,2012,40(5):53-55. 被引量：4
10赵鹏飞,周绍光,裔阳,胡屹群.基于SLIC和主动学习的高光谱遥感图像分类方法[J].计算机工程与应用,2017,53(3):183-187. 被引量：8

计算机工程与应用

2013年第14期

浏览历史

内容加载中请稍等...

K-means算法初始聚类中心选择的优化被引量：50

参考文献9

二级参考文献79

共引文献473

同被引文献451

引证文献50

二级引证文献388

相关作者

相关机构

相关主题

浏览历史

K-means算法初始聚类中心选择的优化 被引量：50

参考文献9

二级参考文献79

共引文献473

同被引文献451

引证文献50

二级引证文献388

相关作者

相关机构

相关主题

浏览历史

K-means算法初始聚类中心选择的优化被引量：50