一种新的密度加权粗糙K-均值聚类算法被引量：11

A novel rough K-means clustering algorithm based on the weight of density

导出

摘要为了克服粗糙K-均值聚类算法初始聚类中心点随机选取,以及样本密度函数定义所存在的缺陷,基于数据对象所在区域的样本点密集程度,定义了新的样本密度函数,选择相互距离最远的K个高密度样本点作为初始聚类中心,克服了现有粗糙K-均值聚类算法的初始中心随机选取的缺点,从而使得聚类结果更接近于全局最优解。同时在类均值计算中,对每个样本根据定义的密度赋以不同的权重,得到不受噪音点影响的更合理的质心。利用UC I机器学习数据库的6组数据集,以及随机生成的带有噪音点的人工模拟数据集进行测试,证明本文算法具有更好的聚类效果,而且对噪音数据有很强的抗干扰性能。 A novel rough K-means clustering algorithm was presented based on the weight of exemplar density to overcome the drawback of selecting initial seeds randomly of available rough K-means algorithms.A new density function was defined for each sample according to the denseness of samples,and the top K samples with higher density and far away from each other were selected as initial centers of a rough K-means clustering algorithm.Also the new weight was defined for each exemplar according to the value of the new density function,so that the better centroids of each cluster could be calculated out without being influenced by noisy data.Experiments on six UCI data sets and on synthetically generated data sets with noise points proved that our algorithm got a better clustering result,and had a strong anti-interference performance for noise data.

作者谢娟英张琰谢维信高新波

机构地区陕西师范大学计算机科学学院西安电子科技大学电子工程学院深圳大学信息工程学院

出处《山东大学学报（理学版）》 CAS CSCD 北大核心 2010年第7期1-6,共6页 Journal of Shandong University(Natural Science)

基金中央高校基本科研业务费专项资金重点资助项目(GK200901006) 陕西省自然科学基础研究计划项目(2010JM3004)

关键词聚类算法粗糙K-均值聚类中心加权密度 clustering algorithm rough K-means clustering center weight density

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1朱明..数据挖掘[M],2002.
2孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1070
3PAWLAK Z. Rough sets[J].International Journal of Information and Computer Sciences, 1982, 11 (5) : 341-356. 被引量：1
4LINGRAS P, WEST C. Interval set clustering of web users with rough K-means [ J ]. Journal of Intelligent Information Systems, 2004, 23(1) : 5-16. 被引量：1
5WANG R Z, MIAO D Q, LI G, et al. Rough overlapping biclustering of gene expression data[ C]//Proceedings of the 7th IEEE International Conference on Bioinformatics and Bioengineering. Washington: 1EEE Computer Society, 2007:828-834. 被引量：1
6郑超,苗夺谦,王睿智.基于密度加权的粗糙K-均值聚类改进算法[J].计算机科学,2009,36(3):220-222. 被引量：25
7PARK H S, JUN C H. A simple and fast algorithm for K-medoids clustedng[J].Expert Systems with Applications, 2009, 36 (2) : 3336-3341. 被引量：1
8SUN Y, ZHU Q M, CHEN Z X. An iterative initial-points refinement algorithm for categorical data clustering [J].Pattern Recognition Letters, 2002, 23 ( 7 ) : 875-884. 被引量：1

二级参考文献11

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2Pawlak Z. Rough sets. International Journal of Information and Computer Sciences, 1982,11 : 145-172 被引量：1
3Lingras P, West C. Interval set clustering of web users with rou - gh k-means. Journal of Intelligent Information Systems, 2004,23 (1):5-1643 被引量：1
4Wang Ruizhi, Miao Duoqian, Li Gang, et al. Rough Overlapping Biclustering of Gene Expression Data//Proceedings of the 7th IEEE International Conference on Bioinformatics and Bioengi- neering. 2007:828-834 被引量：1
5Peters G. Some refinements of rough k-means clustering. Pattern Recognition, 2006,39 (8) : 1481-1491 被引量：1
6Mitra S. An evolutionary rough partitive clustering. Pattern Recognition Letters, 2004,25 (12) : 1429-1449 被引量：1
7Peters G, Lampart M. A Partitive Rough Clustering Algorithm. Rough Sets and Current Trends in Computing,2006,4259(1):658 被引量：1
8Davies D, Bouldin D. A Cluster Separation Measure. IEEE Trans, Pattern Anal, 1979,1 (2) : 224-227 被引量：1
9Blake C L, Merz C J. UCI repository of learning databases, http://www. ics. uci. eud/-mlearn/MLRepository.html 被引量：1
10Sun Y, Zhu Q M, Chen Z X. An iterative initial-points refinement algorithm for categorical data clustering. Pattern Recognition Letters, 2002,23 (7) : 880-883 被引量：1

共引文献1090

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献107

1徐辉,李石君.一种整合粒子群优化和K-均值的数据聚类算法[J].山西大学学报（自然科学版）,2011,34(4):518-523. 被引量：9
2何明,冯博琴,马兆丰,傅向华.基于熵和信息粒度的粗糙集聚类算法[J].西安交通大学学报,2005,39(4):343-346. 被引量：6
3刘靖明,韩丽川,侯立文.一种新的聚类算法——粒子群聚类算法[J].计算机工程与应用,2005,41(20):183-185. 被引量：25
4张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
5吴景岚,朱文兴.基于K中心点的文档聚类算法[J].兰州大学学报（自然科学版）,2005,41(5):88-91. 被引量：4
6淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：82
7HAN Jia-wei, KAMBER M. Data mining concepts and techniques [M]. 2nd ed. [ S. l. ] :Morgan Kaufmann Publishers,2006. 被引量：1
8DING C , LI Tao. Adaptive dimension reduction using discriminate analysis and K-means clustering[ C ]//Proc of the 24th International Conference on Machine Learning. New York : ACM Press, 2007 : 521- 528,. 被引量：1
9SONG Le, SMOLA A, BORGWARDT K M. A dependence maximization view of clustering[C]//Proc of the 24th International Confe- rence on Machine Learning. New York : ACM Press ,2007 : 815 - 822. 被引量：1
10BASTURK B, KARABOGA D, An artificial bee colony (ABC)algorithm for numeric function optimization [ C ]//Proc of IEEE Swarm Intelligence Symposium Indian-apolis. 2006:651- 656. 被引量：1

引证文献11

1刘雷,王洪国,邵增珍,尹会娟.一种基于蜂群原理的划分聚类算法[J].计算机应用研究,2011,28(5):1699-1702. 被引量：6
2张军,黄顺亮.动态粗集理论在K-均值聚类中的应用[J].计算机工程与应用,2011,47(26):25-26. 被引量：1
3谢娟英,郭文娟,谢维信.基于邻域的K中心点聚类算法[J].陕西师范大学学报（自然科学版）,2012,40(4):16-22. 被引量：32
4王学恩,韩德强,韩崇昭.采用不确定性度量的粗糙模糊C均值聚类参数获取方法[J].西安交通大学学报,2013,47(6):55-60. 被引量：9
5张腾飞,陈龙,李云.基于簇内不平衡度量的粗糙K-means聚类算法[J].控制与决策,2013,28(10):1479-1484. 被引量：12
6谢娟英,高瑞.Num-近邻方差优化的K-medoids聚类算法[J].计算机应用研究,2015,32(1):30-34. 被引量：11
7杨续昌,陈友玲,兰桂花,阳玮琦.基于聚类分析和双边匹配的产品开发任务分配方法[J].计算机集成制造系统,2017,23(4):717-725. 被引量：6
8李燕梅.一种基于全局K-均值聚类的改进算法[J].电脑与电信,2017(11):25-27.
9刘洋,王慧琴,张小红.结合蚁群算法的改进粗糙K均值聚类算法[J].数据采集与处理,2019,34(2):341-348. 被引量：15
10陆慎涛,葛洪伟.一种抗噪的移动时间势能聚类算法[J].计算机工程,2020,46(5):144-149.

二级引证文献89

1李会民,闫健卓,方丽英,王普.基于Eros距离的纵向数据模糊聚类方法[J].北京工业大学学报,2013,39(8):1161-1165. 被引量：1
2刘博,安建成.基于关键姿势的人体动作识别[J].电视技术,2014,38(5):38-41. 被引量：8
3殷樱,张玉冰,刘家诚,高昆.基于邻域互信息和K均值的基因选择算法[J].电脑知识与技术,2014(2):821-823.
4王守娜,刘弘,高开周.一种应用于函数优化问题的多种群人工蜂群算法[J].郑州大学学报（工学版）,2018,39(6):30-35. 被引量：4
5赵学武,刘向娇,尹孟洋.数据挖掘常用聚类算法研究[J].电脑知识与技术,2014(6):3710-3712. 被引量：5
6路浩,倪世宏,查翔,张鹏.基于递减概率初始点选择K中心点进化算法[J].计算机仿真,2014,31(9):314-318. 被引量：3
7谢娟英,高瑞.Num-近邻方差优化的K-medoids聚类算法[J].计算机应用研究,2015,32(1):30-34. 被引量：11
8王晓耘,钱璐,黄时友.基于粗糙用户聚类的协同过滤推荐模型[J].现代图书情报技术,2015(1):45-51. 被引量：14
9唐涛,覃晓,易宗剑,韩冬越.基于k中心点聚类的图像二值化方法[J].计算机科学与探索,2015,9(2):234-241. 被引量：10
10罗可,李莲,周博翔.一种蜜蜂交配优化聚类算法[J].电子学报,2014,42(12):2435-2441. 被引量：6

1郑超,苗夺谦,王睿智.基于密度加权的粗糙K-均值聚类改进算法[J].计算机科学,2009,36(3):220-222. 被引量：25
2段文影,李向军,邱桃荣,段隆振.一种具有自适应参数的基于密度加权的粗糙K-均值算法[J].南昌大学学报（理科版）,2012,36(5):498-501. 被引量：5
3曹棣,孔晓斌.基于粗糙k-均值的web事务的聚类[J].山西师范大学学报（自然科学版）,2011,25(2):45-49.
4张政超,关欣,李应升.基于粗糙集与RBF神经网络的雷达辐射源信号识别研究[J].航空计算技术,2009,39(4):18-21. 被引量：2
5洪月华.基于粗糙k-均值的分布式聚类算法[J].广西工学院学报,2013,24(1):89-93. 被引量：1
6余珊琳,钟绍辉.基于粗糙K-均值用户兴趣的聚类算法[J].电脑知识与技术,2013,9(5X):3537-3541. 被引量：1
7夏先智,杜新宇,郑扬飞.基于蚁群遗传算法的属性约简[J].计算机与现代化,2013(1):25-28. 被引量：1
8朱明,林世隆,王俊普.一种聚类型基于示例学习新方法[J].计算机研究与发展,2000,37(11):1293-1297. 被引量：1
9程昊翔,王坚.密度加权孪生支持向量回归机[J].控制与决策,2016,31(4):755-758. 被引量：3
10艾英山,张德贤.基于聚类和密度的KNN分类器训练样本约减方法[J].计算机与数字工程,2009,37(5):10-12.

山东大学学报（理学版）

2010年第7期

浏览历史

内容加载中请稍等...

一种新的密度加权粗糙K-均值聚类算法被引量：11

参考文献8

二级参考文献11

共引文献1090

同被引文献107

引证文献11

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

一种新的密度加权粗糙K-均值聚类算法 被引量：11

参考文献8

二级参考文献11

共引文献1090

同被引文献107

引证文献11

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

一种新的密度加权粗糙K-均值聚类算法被引量：11