一种基于密度最大值的聚类算法被引量：12

Maximum density clustering algorithm

下载PDF

导出

摘要提出了一种结合了基于密度聚类思想的划分聚类方法——"密度最大值聚类算法(MDCA)",以最大密度对象作为起始点,通过考察最大密度对象所处空间区域的密度分布情况来划分基本簇,并合并基本簇获得最终的簇划分.实验表明,MDCA能够自动确定簇数量,并有效发现任意形状的簇,对于未知数据集的处理能力和聚类准确度都优于传统的基于划分聚类算法. This paper proposes a new clustering algorithm named maximum density clustering algorithm（MDCA）. In MDCA the concept of density is introduced to identify the count of clusters automatically. By selecting the densest object as the threshold, densities of those objects around the densest object are reviewed to decide the partition of basic blocks. Then the basic blocks are merged to form clusters of arbitrary shape. Experiments show that the ability and validity of MDCA in processing unknown datasets are all better than traditional partition-based clustering algorithms.

作者王晶夏鲁宁荆继武

机构地区中国科学技术大学电子工程与信息科学系中国科学院研究生院信息安全国家重点实验室

出处《中国科学院研究生院学报》 CAS CSCD 北大核心 2009年第4期539-548,共10页 Journal of the Graduate School of the Chinese Academy of Sciences

基金国家863计划(2006AA01Z454) 电子信息产业发展基金资助

关键词数据挖掘聚类最大密度对象 K-MEANS DBSCAN data mining, clustering algorithm, densest object, k-means, DBSCAN

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1http://www.ics.uci.edu/～ndeam/MLSununary.html. 被引量：1
2TDT3 Multilanguage Text Corpus,Version 2.0;LDC Catalog Number LDC2001T58,isbn:158563-193-0. 被引量：1
3MacQueen J.Some methods for classification and analysis of multivariate observations[C]//LeCam L M,Neymon J,eds.Prec of Fifth Berkeley Symposium on Math.Star and Prob:University of California Press,1967:281-297. 被引量：1
4Tan P N,Steinbach M,等著.范明,范宏建,等译.数据挖掘导论(Introduction to Data Mining)[M].北京:人民邮电出版社,2006. 被引量：1
5Ester M,Kriegel H P,Sander J.A density-based algorithm for discovering clusters in large spatial databases with noise[C]//Uzama M Fayyad,Padhraic Smyth,Gregory Piatetsky-Shapiro,eds.Proc of 2nd International Conference on Knowledge Discovery and Data Mining (KDD' 96).Portland:ACM Press,1996:226-231. 被引量：1
6Ankerst M,Breunig M M,et al.OPTICS:ordering points to identify the clustering structure[C]//Alex Delis,Christos Falontsos,Shahram Ghandeharizadeh,eds.Prec ACM S1GMOD'99 lnt Conf on Management of Data.Philadelphia Pennsylvania:ACM Press,1999:49-60. 被引量：1
7Agrawal R,C,ehrke J,GunopulosD,et al.Automatic subspace clustering of high dimensionaldata fordataminingapplications[C]//LanraHaas,Ashutosh Tiwary,eds.Prec of t998 ACM-SIGMOD Infl Conf on Management of Data.Seattle,Washington:ACM Press,1998:94-105. 被引量：1
8Katzavounidis I,Kuo C,Zhang Z.A new initialization technique for generalized lloyd iteration[J].IEEE Signal Processing Letters,1994,1(10):144-146. 被引量：1
9Tou J T,Ganzalez R C.Pattern recognition principles[M].Dyersburg,TIN,USA:Addison-Wesley,1975. 被引量：1
10Christian Maueeri,Diem Ho.Clustering by kernel density[J].Computational Economics,2007,29(2):199-212. 被引量：1

共引文献1

1黄海平.关于单摆方程的C^(++)语言数值解法[J].东莞理工学院学报,2005,12(1):14-19. 被引量：2

同被引文献83

1朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
2Song Jianhua,Ma Chuanxiang.Anomaly Detection Based on Data-Mining for Routing Attacks in Wireless Sensor Networks[J].China Communications,2008,5(2):34-39. 被引量：2
3周国亮,宋亚奇,王桂兰,朱永利.状态监测大数据存储及聚类划分研究[J].电工技术学报,2013,28(S2):337-344. 被引量：41
4李广凯,李庚银.电力系统仿真软件综述[J].电气电子教学学报,2005,27(3):61-65. 被引量：119
5石陆魁,何丕廉.一种基于密度的高效聚类算法[J].计算机应用,2005,25(8):1824-1826. 被引量：21
6孙国强,卫志农,周封伟.改进迭代自组织数据分析法的不良数据辨识[J].中国电机工程学报,2006,26(11):162-166. 被引量：33
7吕宗磊,王建东.一种基于多维空间超球体的快速聚类算法[J].南京航空航天大学学报,2006,38(6):706-711. 被引量：7
8贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：225
9胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20. 被引量：36
10袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152

引证文献12

1张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43
2高翠芳,胡权.基于清晰半径的模糊点二次聚类算法[J].计算机应用,2013,33(2):547-549. 被引量：1
3肖三,杨雅辉,沈晴霓.基于微簇的在线网络异常检测方法[J].计算机工程与应用,2013,49(6):86-90. 被引量：1
4李有明.一种基于参考点的快速k-均值算法[J].重庆工商大学学报（自然科学版）,2013,30(6):39-43. 被引量：3
5肖进丽,付耀方,程涛.基于AIS信息的单锚泊船舶走锚监测报警方法[J].大连海事大学学报,2018,44(4):8-14. 被引量：2
6魏龙,王勇.基于密度划分的离群点检测算法[J].计算机与现代化,2015(3):26-32. 被引量：5
7王玉雷,李玲娟.一种密度和划分结合的聚类算法[J].计算机技术与发展,2015,25(9):53-56. 被引量：2
8孙小磊,郑华,李晖,王智冬,李隽,王佳明.基于改进DBSCAN算法的变压器不良漏抗参数辨识[J].电力系统自动化,2017,41(9):96-101. 被引量：7
9于兴文,李新霞,龚庆悦,毛文静,沈劼.密度聚类算法在卵巢早衰古代方用药分析中的应用[J].时珍国医国药,2017,28(7):1789-1791. 被引量：1
10李润青,谢明鸿,黄冰晶.一种基于初始点密度最大的改进型ISODATA聚类算法[J].软件导刊,2017,16(12):94-98. 被引量：7

二级引证文献78

1郑丹,王潜平.K-means初始聚类中心的选择算法[J].计算机应用,2012,32(8):2186-2188. 被引量：35
2詹辉煌,朱敏琛.一种改进的动态K-means聚类算法[J].微型机与应用,2012,31(20):74-76. 被引量：2
3李力沛.一种改进的聚类簇数目自动计算算法[J].现代计算机（中旬刊）,2012(10):13-16.
4翟东海,聂洪玉,崔静静,杜佳.基于自适应簇中心选择的文本聚类算法研究[J].成都信息工程学院学报,2013,28(6):617-622. 被引量：1
5何佳.聚类分析算法在供水营销系统中的应用与研究[J].电子世界,2014(5):184-184.
6李婧.一种基于概率的快速聚类算法[J].重庆工商大学学报（自然科学版）,2014,31(2):61-65. 被引量：2
7王勇,唐靖,饶勤菲,袁巢燕.高效率的K-means最佳聚类数确定算法[J].计算机应用,2014,34(5):1331-1335. 被引量：64
8黄红伟,黄天民.基于网格相对密度差的扩展聚类算法[J].计算机应用研究,2014,31(6):1702-1705. 被引量：12
9王祥斌,杨柳,邓伦治.一种利用高斯函数的聚类算法[J].河南科技大学学报（自然科学版）,2014,35(5):33-36. 被引量：7
10黎凡,王新,和晓萍,马晓敏,黎吾鑫.一种基于局部密度的k-means算法[J].云南民族大学学报（自然科学版）,2014,23(6):439-442. 被引量：1

1王常武,王秀芹,魏真真,王宝文,刘文远,李永强.一种可扩展半径的RNA二级结构密度聚类算法[J].小型微型计算机系统,2015,36(9):1968-1972.

中国科学院研究生院学报

2009年第4期

浏览历史

内容加载中请稍等...

一种基于密度最大值的聚类算法被引量：12

参考文献14

共引文献1

同被引文献83

引证文献12

二级引证文献78

相关作者

相关机构

相关主题

浏览历史

一种基于密度最大值的聚类算法 被引量：12

参考文献14

共引文献1

同被引文献83

引证文献12

二级引证文献78

相关作者

相关机构

相关主题

浏览历史

一种基于密度最大值的聚类算法被引量：12