基于样本对加权共协关系矩阵的聚类集成算法被引量：3

Sample pairwise weighting co-association matrix based ensemble clustering algorithm

下载PDF

导出

摘要聚类集成的目标是通过集成多个聚类结果来提高聚类算法的稳定性、鲁棒性以及精度.近些年,聚类集成受到了越来越多的关注.现有的集成聚类通常平等地对待所有基聚类,而不考虑它们的重要度.虽然学者们已经在这一方面做出了一些努力,例如使用加权策略来改进共协关系矩阵,但无论是给基聚类加权还是对类重要度评价时都忽略了样本对于其所在类贡献的差异.为此,提出了基于样本对加权共协关系矩阵的聚类集成算法,该算法利用k.means算法产生多个基聚类结果,然后对于其中的每个类再利用k.means算法产生多个小类,并计算去掉样本对所在的小类后类的不确定性变化的程度来评价该样本对的重要度,最后通过层次聚类算法得到聚类结果.在六个UCI数据集上的实验结果表明,基于样本对加权共协关系矩阵的聚类集成算法的性能优于三种经典的基于共协关系矩阵的聚类集成算法。 The goal of clustering ensemble is to improve the stability, robustness and accuracy of the final clustering results by integrating multiple clustering results. In recent years, clustering ensemble has attracted more and more attention. One limitation of most existing clustering ensemble methods is that they generally treat all base clustering equally, regardless of their importance. Although scholars have made some efforts in this aspect, for example, the weighted strategy is used to improve the co-association matrix. However,they ignore the difference in the contribution of samples to the classes they belong to when either weighting the base clustering or evaluating the class importance. Therefore, sample pairwise weighting co-association matrix based ensemble clustering algorithm is proposed. The algorithm firstly uses the k-means algorithm to generate multiple base partition results and multiple small classes for each class. The importance of the sample to the class is evaluated by calculating the change degree of uncertainty of the class after removing the subclass of the sample pairwise. Finally,the final clustering result can be obtained through the hierarchical clustering algorithm. Experimental results on six UCI data sets show that the performance of sample pairwise weighting co.association matrix based clustering ensemble algorithm is superior to the three classical clustering ensemble algorithms based on co.association matrix.

作者王彤魏巍王锋 Wang Tong;Wei Wei;Wang Feng(School of Computer and Information Technology,Shanxi University,Taiyuan,030006,China;Key Laboratory of Computation Intelligence and Chinese Information Processing,Ministry of Education,Shanxi University,Taiyuan,030006,China)

机构地区山西大学计算机与信息技术学院山西大学计算智能与中文信息处理教育部重点实验室

出处《南京大学学报（自然科学版）》 CAS CSCD 北大核心 2019年第4期592-600,共9页 Journal of Nanjing University（Natural Science）

基金国家自然科学基金(61772323,61303008,61603229,61502288) 山西省高等教育机构科技创新项目(2016111)

关键词聚类聚类集成共协矩阵加权策略 clustering clustering ensemble co-association matrix weighted strategy

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1贾云得,吕宏静,刘万春.鱼眼变形立体图像恢复稠密深度图的方法[J].计算机学报,2000,23(12):1332-1336. 被引量：24
2黄栋,王昌栋,赖剑煌,梁云,边山,陈羽.基于决策加权的聚类集成算法[J].智能系统学报,2016,11(3):418-425. 被引量：4

二级参考文献23

1Shi J，Proceedings of the Conference on Computer Vision and Pattern Recognition,IEEECom，1994年，593页被引量：1
2STREHL A, GHOSH J. Cluster ensembles-a knowledge reuse framework for combining muhiple partitions [ J ]. The journal of machine learning research, 2005, 3(3): 585-617. 被引量：1
3CRISTOFOR D, SIMOVICI D. Finding median partitions u- sing information-theoretical-based genetic algorithms [ J ]. Journal of universal computer science, 2002, 8 ( 2 ) : 153- 172. 被引量：1
4FERN X Z, BRODLEY C E. Solving cluster ensemble prob- lems by bipartite graph partitioning [ C ]//Proceedings of the 21st International Conference on Machine Learning. New York, NY, USA, 2004. 被引量：1
5FRED A L N, JAIN A K. Combining multiple clusterings u-sing evidence accumulation[ J ]. IEEE transactions on pattern analysis and machine intelligence, 2005, 27(6) : 835-850. 被引量：1
6WANG Xi, YANG Chunyu, ZHOU Jie. Clustering aggrega- tion by probability accumulation [ J ]. Pattern recognition, 2009, 42(5): 668-675. 被引量：1
7SINGH V, MUKHERJEE L, PENG Jiming, et al. Ensemble clustering using semidefinite programming with applications [J]. Machine learning, 2010, 79(1/2) : 177-200. 被引量：1
8HUANG Dong, LAI Jianhuang, WANG Changdong. Exploi- ting the wisdom of crowd: a multi-granularity approach to clustering ensemble [ C ]//Proceedings of the 4th Internation- al Conference on Intelligence Science and Big Data Engineer- ing. Beijing, China, 2013: 112-119. 被引量：1
9HUANG Dong, LAI Jianhuang, WANG Changdong. Combi- ning multiple clusterings via crowd agreement estimation and multi-granularity link analysis [ J ]. Neurocomputing, 2015, 170 : 240-250. 被引量：1
10HUANG Dong, LAI Jianhuang, WANG Changdong. Ensem- ble clustering using factor graph [ J ]. Pattern recognition, 2016, 50: 131-142. 被引量：1

共引文献26

1黄有度,苏化明.一种鱼眼图象到透视投影图象的变换模型[J].系统仿真学报,2005,17(1):29-32. 被引量：28
2郑乐丹.全景漫游环境下图书馆馆藏资源展示[J].情报杂志,2005,24(10):64-65. 被引量：1
3黄有度,苏化明.大视角鱼眼镜头图像中的漫游[J].工程图学学报,2006,27(5):44-49. 被引量：2
4文卫国.混凝土裂缝与施工温度[J].煤炭技术,2006,25(12):95-97.
5罗立宏,谭夏梅.基于灰度累积评价的全景图像自动拼接算法[J].兰州理工大学学报,2007,33(3):104-107.
6李晓辉,周荫清,王祖林.基于曲面拼接的球面全景生成算法[J].北京航空航天大学学报,2007,33(6):668-671. 被引量：12
7顾耀林,杨立志.一种过渡光滑的图像浏览方法[J].计算机工程,2007,33(13):207-209. 被引量：2
8杨燕,王雪瑞,戴青,付江柳.球面全景图像生成技术的研究[J].计算机应用与软件,2007,24(10):164-165. 被引量：10
9徐晓冰,王建平,张崇巍,王熹徽.聚光系统中太阳位置的鱼眼图像识别[J].计算机辅助设计与图形学学报,2008,20(3):356-360. 被引量：6
10周天宏,张建清.基于图像映射法的快速无缝拼接技术[J].武汉理工大学学报,2008,30(7):130-133. 被引量：3

同被引文献24

1蔡美峰,王鹏,赵奎,张登科.基于遗传算法的岩体结构面的模糊C均值聚类方法[J].岩石力学与工程学报,2005,24(3):371-376. 被引量：38
2范雷,王亮清,唐辉明.节理岩体结构面产状的动态聚类分析[J].岩土力学,2007,28(11):2405-2408. 被引量：36
3贾慧敏,何光宇,方朝雄,李可文,姚宇臻,黄妹妹.用于负荷预测的层次聚类和双向夹逼结合的多层次聚类法[J].电网技术,2007,31(23):33-36. 被引量：26
4蒋雯倩,李欣然,钱军.改进FCM算法及其在电力负荷坏数据处理的应用[J].电力系统及其自动化学报,2011,23(5):1-5. 被引量：31
5王园.证券业客户细分模型构建及实证研究[J].上海管理科学,2012,34(2):30-35. 被引量：6
6杨春,殷绪成,郝红卫,闫琰,王志彬.基于差异性的分类器集成:有效性分析及优化集成[J].自动化学报,2014,40(4):660-674. 被引量：19
7游丽平,陈德旺,陈文,刘林.聚类集成技术在地铁站点类型研究中的应用[J].小型微型计算机系统,2019,40(1):236-240. 被引量：5
8李夕兵,王泽伟,彭康,刘志祥.Ant colony ATTA clustering algorithm of rock mass structural plane in groups[J].Journal of Central South University,2014,21(2):709-714. 被引量：9
9宋腾蛟,陈剑平,张文,宋盛渊.基于萤火虫算法的岩体结构面优势产状聚类分析[J].东北大学学报（自然科学版）,2015,36(2):284-287. 被引量：10
10冯晨菲,杨燕,王红军,徐英歌,王韬.一种基于数据相关性的半监督模糊聚类集成方法[J].计算机科学,2015,42(6):41-45. 被引量：1

引证文献3

1黄飞杰,郎旭明,尹健康,张卫东,唐靖.聚类集成算法在客户细分模型中的应用[J].西南科技大学学报,2020,35(1):75-80. 被引量：9
2严强,李扬,樊友杰,陈逸涵,郭吉群.基于加权表决集成聚类的居民用电行为回归分析[J].电网技术,2021,45(11):4435-4443. 被引量：17
3张化进,吴顺川,韩龙强.基于DBSCAN选择性聚类集成的岩体结构面优势产状分组方法[J].岩土力学,2022,43(6):1585-1595. 被引量：7

二级引证文献33

1曹聪,秦秀山,于世波,王虎强,曹雪伟.某铜镍矿两步骤嗣后充填回采地压分布与采场稳定性研究[J].中国矿业,2024,33(S01):297-303.
2王楚鑫,王迎超,董传新,武佩锋,张政.基于时间序列聚类和粒模型的地面沉降模式分析[J].岩土力学,2024,45(S01):631-644.
3冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：13
4李健,姜楠,宝音巴特,张帆,张伟健,王薇.空间颜色聚类算法及其在图像特征提取中的应用[J].吉林大学学报（理学版）,2020,58(3):627-633. 被引量：12
5吴涛.基于RFM模型的电子商务顾客细分研究[J].铜陵学院学报,2020,19(5):55-59. 被引量：1
6唐靖,韩叔君,刘严,朱广邻,王耀海.基于大数据分析的促实体经济精准营销方案研究[J].现代工业经济和信息化,2021,11(3):121-122. 被引量：1
7刘坤达,宋红文,张卫东,欧达宇.品牌优先的零售客户细分研究[J].现代商贸工业,2021,42(32):45-46. 被引量：3
8林永康,覃梦岚,朱浩荣.人工智能技术在中职学生管理数据平台中的应用[J].西部素质教育,2022,8(9):145-147. 被引量：1
9张慧波,王守相,赵倩宇,任杰,王海.考虑数据不均衡的居民用户负荷曲线分类方法[J].电力工程技术,2022,41(3):186-193. 被引量：8
10李扬,严强,樊友杰,史云鹏.基于优先级队列的居民需求响应策略自趋优方法[J].电力工程技术,2022,41(4):169-176. 被引量：4

1杨鑫,施虹,王平心,徐刚.基于稳定性的三支聚类[J].南京大学学报（自然科学版）,2019,55(4):546-552. 被引量：3
2杨文君.入侵检测技术中k-means聚类算法综述[J].科学技术创新,2018(36):65-66. 被引量：3
3娄道国,李若斌,刘冰,张冬冬.云计算下各分散文本数据的全方位集成融合方法[J].科技通报,2019,35(2):85-88. 被引量：4
4钱虹,古雅琦,刘鑫杰.基于动态故障树的核反应堆稳压器数字压力控制装置可靠性研究[J].核动力工程,2019,40(3):103-108. 被引量：15
5黄灵,王云锋,陈光武.基于密度标准差优化初始聚类中心的k＿means改进算法[J].电脑知识与技术,2019,15(2X):147-151. 被引量：3
6赵森,魏明军.基于k-means算法的入侵检测研究[J].河北能源职业技术学院学报,2019,19(2):66-69. 被引量：1
7王丽娟,丁世飞,贾洪杰.基于消息传递的谱聚类算法[J].数据采集与处理,2019,34(3):548-557. 被引量：1
8杜婷婷,文国秋,吴林,童涛,谭马龙.基于局部协方差矩阵的谱聚类算法[J].计算机工程与应用,2019,55(14):148-154. 被引量：7
9郭刚,詹新明,侯立民,张社安,沈建良.基于重要度排序与全寿命周期的配网故障治理措施优化方法[J].电力大数据,2019,22(5):81-87. 被引量：3
10李炅菊,黄宏光,舒勤.相依网络理论下电力通信网节点重要度评价[J].电力系统保护与控制,2019,47(11):143-150. 被引量：28

南京大学学报（自然科学版）

2019年第4期

浏览历史

内容加载中请稍等...

基于样本对加权共协关系矩阵的聚类集成算法被引量：3

参考文献2

二级参考文献23

共引文献26

同被引文献24

引证文献3

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于样本对加权共协关系矩阵的聚类集成算法 被引量：3

参考文献2

二级参考文献23

共引文献26

同被引文献24

引证文献3

二级引证文献33

相关作者

相关机构

相关主题

浏览历史

基于样本对加权共协关系矩阵的聚类集成算法被引量：3