基于协同熵的K-均值算法

K-Means Algorithm Based on Co-entropy

下载PDF

导出

摘要针对传统K-均值算法容易受到野点和噪声点的影响,缺乏鲁棒性的问题,提出了一种基于协同熵的K-均值算法。该方法利用协同熵作为一种局部的相似度度量手段,并依赖最大协同熵准则进行最优聚类中心的求解。采用迭代重加权的优化算法可以用来快速实现最优聚类中心的求解。对于残差较大的野点和噪声,它们在聚类中心更新的过程中将被赋予较小的权重。实验结果表明,基于协同熵的K-均值算法具有较好的鲁棒性,并获得较好的聚类效果。 Considering the fact that conventional K-means algorithm is susceptible to the outliers and noise points,and lacking in robustness,a new K-means algorithm based on co-entropy is proposed. The proposed algorithm employs co-entropy as a means of local similarity measurement,and follows the co-entropy maximization principle to solve the optimal cluster centers. An iteratively reweighted optimization technique is employed to quickly find the optimal cluster centers. For outliers and noisy data points with larger residuals,they will be assigned smaller weights in updating the cluster centers. Experimental results demonstrate that the proposed co-entropy based K-means algorithm is robust,winning a better clustering effect.

作者罗蜀君侯飞毛鑫

机构地区中国航空工业集团公司洛阳电光设备研究所

出处《电光与控制》北大核心 2015年第7期66-69,共4页 Electronics Optics & Control

关键词 K-均值算法协同熵聚类 K-means algorithm co-entropy cluster

分类号 O213.2 [理学—概率论与数理统计]

引文网络
相关文献

参考文献13

1XU C, TAO D C, XU C. Large-margin multi-viewinforma- tion bottleneck[ J]. IEEE Transactions on Pattern Analy- sis and Machine Intelligence, 2014, 36 ( 8 ) : 1559-1572. 被引量：1
2XU C, TAO D C, XU C, et al. Large-margin Weakly super- vised dimensionality reduction[ C]//Proceedings of the 31st International Conference on Machine Learning, Beijing, 2014:865-873. 被引量：1
3XU C, TAO D C, LI Y X, et al. Large-margin multi-viewGaussian process for image classification [ C ]//Proceed- ings of the 15th International Conference on Internet Mul- timedia Computing and Service, ACM, 2013:7-12. 被引量：1
4XU C, TAO D C, XU C. A survey on multi-view learning [ EB/OL ]. [ 2015-04-10 1. http ://arxiv. org/abs/1304. 5634. 被引量：1
5PETORS D, ALAN M F, RAVI K, et al. Clu.stering large graphs via the singular value decomposition [ J ]. Machine Learning, 2004, 56( 1 ) :9-33. 被引量：1
6TAO D P, LIANG L Y, JIN L W, et al. Similar handwritten Chinese character recognition by kernel discriminative lo- cality alignment [ J 1. Pattern Recognition Letters, 2014, 35 (1) :186-194. 被引量：1
7TAO D P, JIN L W, WANG Y F, et al. Rank preserving discriminant analysis for human behavior recognition on wireless sensor networks [ J ]. IEEE Transactions on In- dustrial Informatics, 2014, 10( 1 ) :813-823. 被引量：1
8TAO D P, JIN L W, YANG Z, et al. Rank preserving sparse learning for kinect based scene classification [ J ]. IEEE Transactions on Cybernetics, 2013, 43 (5) : 1406-1417. 被引量：1
9桂云苗,朱金福.一种用信息熵确定聚类权重的方法[J].统计与决策,2005,21(08X):29-30. 被引量：12
10周漩,张凤鸣,惠晓滨,李克武.基于信息熵的专家聚类赋权方法[J].控制与决策,2011,26(1):153-156. 被引量：29

二级参考文献19

1戚继忠,丁梦娟,王宝良.数量分类的加权聚类法[J].吉林林学院学报,1995,11(2):91-95. 被引量：5
2邵锐,巫兆聪,钟世明.粗糙集理论在遥感影像分割中的应用[J].地理空间信息,2005,3(5):26-28. 被引量：5
3曾雪兰,吉建华,吴小欢.基于相容性指标的聚类分析专家赋权法[J].广西大学学报（自然科学版）,2005,30(4):337-340. 被引量：24
4傅祖芸.信息论[M].北京:电子工业出版社,2007. 被引量：8
5Ding S F, Shi Z Z. Studies on incidence pattern recognition based on information entropy[J]. J of Information Science, 2005, 31(6): 497-502. 被引量：1
6Cover T M, Thomas J A. Elements of information theory[M]. New York: John Wiley and Sons, 1991. 被引量：1
7Hwang C L, Yoon K S. Multiple attribute decision making and application[M]. New York: Springer-Verlag, 1981. 被引量：1
8Jessop A. Entropy in multi-attribute problems[J]. J of Multi-criteria Decision Analysis, 1999, 8(2): 61-70. 被引量：1
9[英]AndrewR.Webb.王萍等译.统计模式识别[M].北京:电子工业出版社,2004.10.. 被引量：1
10唐守正.多元统计分析方法[M].北京：中国林业出版社,1989.29-102. 被引量：19

共引文献45

1徐景涛,董志勇,王长柏.废弃矿井地下空间开发仓储功能适宜性评价[J].煤炭经济研究,2022,42(3):51-57. 被引量：1
2周建国,王潇炜.基于博弈论和灰色关联度的区域电力市场运营效果评价指标体系[J].电网技术,2007,31(10):69-73. 被引量：27
3陈娟,周家纪.采用数据挖掘的入侵检测技术研究[J].铁路计算机应用,2007,16(9):10-12.
4丁勇,牛建明,陈立荣,董建军,贾晋锋,李秀萍,胡尔查,郭婧.家庭牧场复合生态系统可持续发展评价[J].水土保持通报,2008,28(2):173-179. 被引量：17
5胡志定,王慧,张强.基于模板匹配的航片框标定位法[J].海洋测绘,2009,29(4):42-45. 被引量：1
6张雪峰,尚金奎.基于蒙特卡罗方法和粗糙熵标准的图像分割方法[J].石油化工高等学校学报,2009,22(3):94-98. 被引量：2
7磨少清,刘正光,张军.基于Mean Shift的大车车型分类特征提取[J].天津大学学报,2009,42(11):965-969.
8姜晓剑,刘小军,田永超,姜海燕,曹卫星,朱艳.基于遥感影像的作物生长监测系统的设计与实现[J].农业工程学报,2010,26(3):156-162. 被引量：13
9索瑞霞,王福林,朱会霞.基于IAHP和信息熵的粮食可持续发展综合评价——以黑龙江省为例[J].技术经济,2010,29(11):81-85. 被引量：3
10刘健,刘思峰,周献中,薛利.多属性决策决问题的满意度与赋权研究[J].中国管理科学,2011,19(6):126-132. 被引量：5

1高尚,杨静宇,吴小俊.聚类问题的蚁群算法[J].计算机工程与应用,2004,40(8):90-91. 被引量：27
2周洪斌.基于粒子群优化算法的模糊聚类分析[J].现代计算机,2008(6):28-30.
3景志远.遗传K-均值算法在软件测试算例自动生成中的应用研究[J].油气田地面工程,2003,22(4):15-16.
4李聪明.基于差分算法的K-均值聚类分析[J].现代计算机,2008,14(6):67-69. 被引量：2
5叶萍.基于隶属度改进的模糊K-均值算法[J].长春工程学院学报（自然科学版）,2007,8(1):82-84.
6王庆飞.基于隶属度改进的模糊K-均值算法[J].科技信息,2007(27):196-196.
7郭德超,胡昌盛.一种K-均值聚类的改进算法[J].科学时代,2013(23).
8李洁,高新波,焦李成.一种基于CSA的模糊聚类新算法(英文)[J].复旦学报（自然科学版）,2004,43(5):815-818.
9王大伟,王元,杨斌.风沙两相流PIV测量算法研究[J].力学学报,2006,38(3):302-308. 被引量：12
10冯琴荣,王芬芬.基于模糊软集的群决策方法研究[J].西北大学学报（自然科学版）,2016,46(4):475-480.

电光与控制

2015年第7期

浏览历史

内容加载中请稍等...

基于协同熵的K-均值算法

参考文献13

二级参考文献19

共引文献45

相关作者

相关机构

相关主题

浏览历史