一种基于互信息的模糊聚类集成算法被引量：2

Fuzzy Clustering Ensemble Based on Mutual Information

下载PDF

导出

摘要聚类集成是机器学习中的新问题.它是利用同一数据集的多个聚类划分集成在一起,以提高聚类分析的性能.如何发现从多个划分中得到“consensusclustering”是一个很困难的问题.很多学者对此作了研究.本文提出了一种基于互信息的模糊聚类集成算法.该算法主要扩展了Strehl&Ghosh提出的基于互信息的聚类集成目标函数,将其应用到模糊划分的集成,同时利用类似于信息瓶颈聚类的算法进行求解.实验结果表明,在4个UCI的数据集上,基于互信息的聚类集成能获得良好的性能. Clustering ensemble is a new topic in machine learning. It can find a combined clustering with better quality from multiple partitions. But how to finding the consensus clustering is a difficult problem, In this paper, we proposed a new algorithm for ＂fuzzy＂ clustering ensemble, This ensemble algorithm is base on the mutual information for clustering ensemble and is similar to Information Bottleneck clustering（IB）. Experiments on four real-world data sets indicate that our algorithm provides solutions with improved quality.

作者高琰谷士文唐琎蔡自兴

机构地区中南大学信息科学与工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2007年第6期1068-1071,共4页 Journal of Chinese Computer Systems

基金国家自然科学基金重点项目(60234030)资助.

关键词聚类集成互信息信息瓶颈 clustering ensemble mutual information information bottleneck

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献13

1Dietterich T G.Machine learning research:four current directions[J].AI Magazine,1997,18(4):97-136. 被引量：1
2Strehl A,Ghosh J.Cluster ensembles-a knowledge reuse framework for combining partitions[C].In:Proc.Conference on Artificial Intelligence (AAAI 2002),Edmonton,93-98. 被引量：1
3Fred A L N,Jain A K.Data clustering using evidence accumulation[C].In:Proc.of the 16th International Conference on Pattern Recognition,ICPR 2002,Quebec City,276-280. 被引量：1
4Fern X Z,Brodley C E.Random projection for high dimensional data clustering:a cluster ensemble approach[C].In:Proceedings of the 20th International Conference on Machine Learning,2003,186-193. 被引量：1
5Monti S,Tamayo P,Mesirov J,et al.Consensus clustering:a resampling-based method for class discovery and visualization of gene expression microarray data[J].Machine Learning,2003,52,91-118. 被引量：1
6Topchy A,Jain A,Punch W.A mixture model for clustering ensembles[C].In:Proc.SIAM Data Mining,2004,379-390. 被引量：1
7唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
8Frossyniotis D,Likas A,Stafylopatis A.A clustering method based on boosting[Z].Pattern Recognition Letters 25 (2004),641-654. 被引量：1
9Noam Slonim.The information bottleneck:theory and applications[D].Hebrew University,Jerusalem,Israel,2002. 被引量：1
10Blake C,Keogh E,Merz C J.UCI repository of machine learning databases[EB/OL].Irvine:Department of Information and Computer Science,University of California,1998,http://www.ics.uci.edu/～mlearn/MLRepository.html. 被引量：1

二级参考文献14

1Estivill-Castro V. Why so many clustering algorithms-A position paper. SIGKDD Explorations, 2002,4(1):65-75. 被引量：1
2Dietterich TG. Machine learning research: Four current directions. AI Magazine, 1997,18(4):97-136. 被引量：1
3Breiman L. Bagging predicators. Machine Learning, 1996,24(2):123-140. 被引量：1
4Zhou ZH, Wu J, Tang W. Ensembling neural networks: Many could be better than all. Artificial Intelligence, 2002,137(1-2):239-263. 被引量：1
5Strehl A, Ghosh J. Cluster ensembles-A knowledge reuse framework for combining partitionings. In: Dechter R, Kearns M,Sutton R, eds. Proc. of the 18th National Conf. on Artificial Intelligence. Menlo Park: AAAI Press, 2002. 93-98. 被引量：1
6MacQueen JB. Some methods for classification and analysis of multivariate observations. In: LeCam LM, Neyman J, eds. Proc. of the 5th Berkeley Symp. on Mathematical Statistics and Probability. Berkeley: University of California Press, 1967,1:281-297. 被引量：1
7Blake C, Keogh E, Merz CJ. UCI Repository of machine learning databases. Irvine: Department of Information and Computer Science, University of California, 1998. http://www.ics.uci.edu/～mlearn/MLRepository.html 被引量：1
8Modha DS, Spangler WS. Feature weighting in k-means clustering. Machine Learning, 2003,52(3):217-237. 被引量：1
9Zhou ZH, Tang W. Clusterer ensemble. Technical Report, Nanjing: AI Lab., Department of Computer Science & Technology,Nanjing University, 2002. 被引量：1
10Fern XZ, Brodley CE. Random projection for high dimensional data clustering: A cluster ensemble approach. In: Fawcett T, Mishra N, eds. Proc. of the 20th Int'l Conf. on Machine Learning. Menlo Park: AAAI Press, 2003. 186-193. 被引量：1

共引文献94

1李士进,朱跃龙,刘净.一种基于k-prototype的多层次聚类改进算法[J].河海大学学报（自然科学版）,2007,35(3):342-347. 被引量：1
2张莉,陈恭和.一种适合大规模数据集的特征选择方法[J].计算机工程,2007,33(4):184-186. 被引量：1
3罗会兰,孔繁胜,李一啸.聚类集成中的差异性度量研究[J].计算机学报,2007,30(8):1315-1324. 被引量：36
4张妤,王文剑,康向平.一种回归SVM选择性集成方法[J].计算机科学,2008,35(4):178-180. 被引量：7
5刘明,袁保宗,苗振江,唐晓芳,李昆仑.从局部分类精度到分类置信度的变换[J].计算机研究与发展,2008,45(9):1612-1619. 被引量：6
6罗会兰,孔繁胜,李一啸.基于添加人工数据的高差异性聚类集体生成方法[J].模式识别与人工智能,2008,21(5):682-688.
7王红军,李志蜀,成飏,周鹏,周维.基于隐含变量的聚类集成模型[J].软件学报,2009,20(4):825-833. 被引量：14
8郭红玲,程显毅.多分类器选择集成方法[J].计算机工程与应用,2009,45(13):186-187. 被引量：7
9孟凡荣,郝晓昀,周勇.基于文化算法的选择性神经网络集成方法[J].小型微型计算机系统,2009,30(5):933-936. 被引量：2
10罗会兰,危辉.一致性函数研究[J].计算机工程与应用,2009,45(17):1-4. 被引量：1

同被引文献20

1柏森,廖晓峰.基于Walsh变换的图像置乱程度评价方法[J].中山大学学报（自然科学版）,2004,43(A02):58-61. 被引量：39
2商艳红,李南,邹建成.Fibonacci变换及其在数字图像水印中的应用[J].中山大学学报（自然科学版）,2004,43(A02):148-151. 被引量：26
3卢振泰,黎罗罗.一种新的衡量图像置乱程度的方法[J].中山大学学报（自然科学版）,2005,44(B06):126-129. 被引量：37
4吕庆文,陈武凡.基于互信息量的图像分割[J].计算机学报,2006,29(2):296-301. 被引量：40
5吕庆文,陈武凡.基于互信息熵差测度的医学图像自动优化分割[J].中国科学（E辑）,2006,36(6):657-667. 被引量：11
6李志伟,陈燕梅,张胜元.基于SNR的数字图像置乱程度评价方法[J].厦门大学学报（自然科学版）,2006,45(4):484-487. 被引量：30
7卢振泰,陈武凡.基于共生互信息量的医学图像配准[J].计算机学报,2007,30(6):1022-1027. 被引量：27
8BARRITI R. Using mutual information for selecting features in supervised neural net learning[ J]. IEEE Transactions on Neural Networks, 1994, 5 (4) : 537 - 550. 被引量：1
9MAES F, COLLIGNON A. Muhimedality image registration by maximization of mutual information[ J]. IEEE Transactions on Medical Image, 1997,16(2) : 187 - 198. 被引量：1
10柏森,曹长休.图像置乱程度研究[C]//全国第三届信息隐藏学术研讨会论文集.西安:西安电子科技大学,2001:75-81. 被引量：25

引证文献2

1吴成茂,田小平,谭铁牛.基于差分互信息距离的图像置乱效果评价法[J].计算机应用,2009,29(5):1293-1296. 被引量：5
2朱敏铭,张磊.OMI特征提取算法及关于风险偏好的决策规则的研究[J].现代计算机,2010,16(5X):5-9. 被引量：1

二级引证文献6

1杨昔阳,李志伟.置乱均匀性的优度拟合统计分析[J].厦门大学学报（自然科学版）,2010,49(6):778-781. 被引量：1
2王新新,布挺.基于图像表面积的置乱程度评价算法[J].安徽大学学报（自然科学版）,2011,35(4):48-52. 被引量：4
3陈建校,王超,袁文烨.地铁列车主动维保平台及关键技术[J].机车电传动,2012(1):58-61. 被引量：3
4李虎雄.基于图像特征的数字图像置乱程度衡量方法[J].计算机工程与设计,2012,33(6):2338-2342.
5晋建秀,郑宜峰,李叙琼.基于分块信息熵方差的图像置乱程度评估[J].华南理工大学学报（自然科学版）,2013,41(3):8-14. 被引量：4
6裘咏霄,刘阳.基于差分熵的板材缺陷检测[J].铸造技术,2013,34(6):783-785. 被引量：2

1辛伯宇.基于查询的XML数据库设计[J].电脑开发与应用,2013,26(11):32-33.
2柏战华,吕强.基于WebService和OPC技术的综合监控系统[J].微计算机信息,2008,24(7):54-55. 被引量：6
3王刚,许信顺.一种新的基于多示例学习的场景分类方法[J].山东大学学报（理学版）,2010,45(7):108-113. 被引量：3
4李德栋,肖楚琬,庞威.基于信息瓶颈法的图像分离-合并分割算法[J].计算机与现代化,2013(11):20-24.
5夏利民,谭立球,钟洪.基于信息瓶颈算法的图像语义标注[J].模式识别与人工智能,2008,21(6):812-818. 被引量：6
6路光辉,姬波,雍明超,周钟,牧继清.基于信息瓶颈的变压器故障诊断算法[J].计算机工程与设计,2015,36(8):2271-2276.
7朱琳,王宇杰.信息瓶颈方法在无监督图像聚类中的研究[J].微计算机信息,2008,24(24):308-309.
8沈华伟,程学旗,陈海强,刘悦.基于信息瓶颈的社区发现[J].计算机学报,2008,31(4):677-686. 被引量：27
9谭立球,夏利民,谷士文.基于信息瓶颈算法的图像分割[J].计算机工程,2008,34(18):215-216.
10贺一帆,江铭虎.网络文本分类中基于信息瓶颈的特征提取[J].清华大学学报（自然科学版）,2010,50(1):45-48. 被引量：6

小型微型计算机系统

2007年第6期

浏览历史

内容加载中请稍等...

一种基于互信息的模糊聚类集成算法被引量：2

参考文献13

二级参考文献14

共引文献94

同被引文献20

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种基于互信息的模糊聚类集成算法 被引量：2

参考文献13

二级参考文献14

共引文献94

同被引文献20

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种基于互信息的模糊聚类集成算法被引量：2