一种简单有效的基于密度的聚类分析算法被引量：8

A Simple and Valid Density-Based Clustering Algorithm

下载PDF

导出

摘要对数据挖掘中基于密度聚类的相关概念和算法进行了讨论,对OPTICS(O rdering Pointers to Iden-tify the C lustering Structure)算法聚类分析的正确性给以了证明。以DBSCAN,OPTICS为基础,提出了一种基于密度的简单有效的聚类算法。新算法主要在ε-邻域查询和种子队列的更新两个方面作了改进,给出了一种简单、效率较高的邻域查询方法-哈希表法,即对整个数据集合或部分数据作网格化处理。测试结果表明新算法能够有效地对大规模数据进行聚类,效率较高。 After discussing the concepts and algorithms of density-based clustering, the correctness of cluster analysis of OPTICS（Ordering Pointers to Identify the Clustering Structure） algorithm is proved. Moreover, a simple and valid density -based clustering algorithm is proposed, which is based on the original DBSCAN and OVFICS. The new algorithm makes improvements on region query and update of seeds queue. A simple and efficient region query method, hash - table method is developed. Experimental results show that the new algorithm is effective and efficient in clustering large -scale data sets.

作者陈燕俐洪龙金达文朱梧槚

机构地区南京邮电大学计算机科学与技术系南京航空航天大学信息科学与技术学院

出处《南京邮电学院学报（自然科学版）》 2005年第4期24-29,共6页 Journal of Nanjing University of Posts and Telecommunications

关键词数据挖掘聚类距离密度邻域查询 Data Mining Clustering Distance Density Region Queries

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1邵峰晶,于忠清编著..数据挖掘原理与算法[M].北京:中国水利水电出版社,2003:322.
2NG R T,HAN J.Efficient and effective clustering methods for spatial datamining[A].In:Proc of the 20th VLDB Conf[C].Santiago: MorganKaufmann,1994.144～155. 被引量：1
3ANKERST M, BREUNIG M.KRIEGEL H -P,et al.OPTICS: Ordering points to identify the clustering structure[A].In Proc 1999 ACM-SIGMOD Int Conf Management of Data[C]. Philadelphia, PA, June 1999.49～60. 被引量：1
4HAN Jiawei,KAMBER M. Data Mining,Concepts and Techniques[M]. CA:Morgan Kaufmann Publishers, 2000. 被引量：1
5JAIN A K,MURTY M N,FLYNN P J.Data Clustering:A Survey[J].ACM Comput Surv, 1999,31:264～323. 被引量：1
6ESTER M,KRIEGEL H -P,SANDER J,et al.A Density-Based Algorithm for Discovering Clusterin Large Spatial Databases[A].In Proc 1996 Int Conf(KDD'96)[C].1996.226～231. 被引量：1
7DATE C J. An Introduction to Database Systems,7th ed[M].MA:Addision-Wesley,2000. 被引量：1
8周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42

二级参考文献6

1Sheikholeslami G，Proceedings of the 2 4th VL DB Conference，1998年，428页被引量：1
2Zhang W，Proceedings of the 2 3rd VL DB Conference，1997年，186页被引量：1
3Chen M S，IEEE Transactions on Knowledge andData Engineering，1996年，8卷，6期，866页被引量：1
4Ester M，Proceedings of the 2nd International Conference on Knowledge Discovering in Data，1996年，226页被引量：1
5Zhang T，Proceedings of the ACM SIGMOD International Conference on Management of Data，1996年，103页被引量：1
6Ng R T，Proceedings of the2 0 th VL DB Conference，1994年，144页被引量：1

共引文献41

1刘嘉嘉,杜习英.一种新的基于密度的自适应取样聚类算法[J].电脑知识与技术（过刊）,2007(2):478-480.
2张海龙,王仁彪,聂俊,刘进忠.海量数据的网格启发信息密度聚类算法[J].吉林大学学报（工学版）,2011,41(S2):254-258. 被引量：2
3宋明,刘宗田.基于数据交叠分区的并行DBSCAN算法[J].计算机应用研究,2004,21(7):17-20. 被引量：9
4何中胜,刘宗田,庄燕滨.基于数据分区的并行DBSCAN算法[J].小型微型计算机系统,2006,27(1):114-116. 被引量：16
5张枫,邱保志.基于网格的高效DBSCAN算法[J].计算机工程与应用,2007,43(17):167-169. 被引量：8
6卢炎生,娄强.障碍空间里基于密度的快速聚类算法[J].小型微型计算机系统,2007,28(11):1976-1980. 被引量：4
7王翠茹,朵春红.一种改进的基于密度的DBSCAN聚类算法[J].广西师范大学学报（自然科学版）,2007,25(4):104-107. 被引量：4
8胡学钢,王东波,吴共庆.一种基于层次树的高效密度聚类算法[J].合肥工业大学学报（自然科学版）,2008,31(2):187-190. 被引量：4
9蔡永旺,杨炳儒.适用于公交站点聚类的DBSCAN改进算法[J].计算机工程,2008,34(10):190-192. 被引量：3
10易宝林,伍仪强,丰大洋,张小莉.基于DBSCAN的批量更新聚类算法[J].计算机工程,2009,35(2):63-64. 被引量：6

同被引文献65

1刘梓,唐振民,任明武.基于3D激光雷达的实时道路边界检测算法[J].华中科技大学学报（自然科学版）,2011,39(S2):351-354. 被引量：17
2周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
3王一夫,陈松乔,陈安.海量数据预测模型设计及案例分析[J].计算机工程与应用,2005,41(19):170-173. 被引量：7
4刘敏昆,李莉.计算机等级考试对计算机教学的导向[J].云南师范大学学报（自然科学版）,2005,25(6):71-74. 被引量：27
5王勇,张新政,高向军.时序规则挖掘[J].计算机工程,2005,31(23):61-62. 被引量：3
6何中胜,刘宗田,庄燕滨.基于数据分区的并行DBSCAN算法[J].小型微型计算机系统,2006,27(1):114-116. 被引量：16
7HANJia-wei,Micheline Kanber著.数据挖掘概念与技术[M].北京:机械工业出版社,2007 被引量：15
8Pei Jian,Han Jia-wei,Mortazavi-Asl B,Prefix span:mining sequential patterns by prefix-projected growth[C]//Proc of the 17th IEEE International Conference on Data Engineering(1CDE),2001:215-224. 被引量：1
9Agrawal R,Srikant R.Mining sequential patterns[C]//Proceeding of the 11th Conf Data Engineering, 1995:3-14. 被引量：1
10Tan Pang-Ning,Steinbach M,Kumar V.数据挖掘导论[M].范明,范宏建译.北京:人民邮电出版社,2006. 被引量：30

引证文献8

1于重重,杨扬,涂序彦,张莹,张佳.DBSCAN算法在桥梁健康监测预测模型中的应用[J].计算机工程与应用,2008,44(12):224-227. 被引量：4
2赵双柱.基于相对密度的聚类算法研究与应用[J].现代计算机,2013,19(9):3-7. 被引量：2
3段明秀,唐超琳.一种基于密度的聚类算法实现[J].吉首大学学报（自然科学版）,2013,34(1):26-27. 被引量：5
4张晓倩,杨波,王琳,梁志锋.使用DBSCAN的FCM神经网络分类器[J].模式识别与人工智能,2016,29(2):185-192. 被引量：5
5冯玲,刘克剑,唐福喜,孟庆瑞.一种基于网格查询的改进DBSCAN算法[J].西华大学学报（自然科学版）,2016,35(5):25-29. 被引量：8
6安建瑞,张龙波,王雷,金超,怀浩,王晓丹.一种基于网格与加权信息熵的OPTICS改进算法[J].计算机工程,2017,34(2):206-209. 被引量：11
7段建民,王昶人,任璐,刘丹.基于多层激光雷达的可行驶区域信息提取算法[J].电子技术应用,2017,43(10):78-82. 被引量：9
8李玉萍,徐瑞朝.基于网格密度的聚类算法的性能比较分析[J].电脑知识与技术（过刊）,2010,16(3X):1952-1953.

二级引证文献44

1王丹丹,付华,徐耀松.基于DBSCAN算法的煤矿瓦斯监测信息聚类分析方法研究[J].工矿自动化,2010,36(8):45-48. 被引量：2
2袁春花.一种基于改进DBSCAN算法的煤矿瓦斯数据挖掘方法[J].煤炭技术,2012,31(11):177-179.
3于重重,吴子珺,谭励,涂序彦,田蕊.非平衡集成迁移学习模型及其在桥梁结构健康监测中的应用[J].智能系统学报,2013,8(1):46-51. 被引量：4
4龙威,周昕.5种磺胺类药物SN、ST、SD、SG及SMP分子活性的量子化学计算[J].青岛科技大学学报（自然科学版）,2013,34(4):362-367. 被引量：3
5郝晓丽,张靖.基于改进自适应聚类算法的RBF神经网络分类器设计与实现[J].计算机科学,2014,41(6):260-263. 被引量：21
6龙威.菊糖同分异构体活性的密度泛函研究[J].首都师范大学学报（自然科学版）,2014,35(5):43-50. 被引量：3
7胡贤德,朱秀祥,李敬明,李苗.基于聚类算法的人脸衰老图像重构[J].长春师范大学学报,2016,35(10):34-38.
8彭刚跃,吉渊明,岳建平,李静,宋亚宏.基于聚类分析的多波束测深数据滤波方法研究[J].测绘工程,2016,25(9):31-34. 被引量：1
9魏伟一,杨阳.一种基于块熵的均匀嵌入隐写算法[J].计算机工程,2017,43(12):274-277. 被引量：1
10呙鹏程,王星,田元荣.基于CEEMDAN-ASVM的低截获概率雷达信号识别[J].现代雷达,2018,40(3):27-32. 被引量：3

1过洁,潘金贵.一种新的基于线性四叉树的图像分割算法[J].系统仿真学报,2009,21(S1):54-56. 被引量：1
2朱楚宏,汤开文.空间数据库中的三种查询优化方法[J].国土资源导刊,2009,6(1):64-67.
3孙殿柱,刘华东,史阳,李延瑞.基于核密度估计的散乱点云边界特征提取[J].农业机械学报,2013,44(12):275-279. 被引量：14
4冯振华,钱雪忠,赵娜娜.Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法[J].计算机应用研究,2016,33(9):2693-2696. 被引量：45
5孙殿柱,白银来,李延瑞,李聪.散乱点集拓扑邻域均值逆向漂移查询算法[J].机械工程学报,2015,51(1):182-187. 被引量：2
6林硕蕾.基于小数据冲突检测的坏点数据挖掘模型仿真[J].科技通报,2015,31(1):213-216. 被引量：2
7吕文强,杨健.一种有效的提高车牌首字符识别率的方法[J].计算机科学,2013,40(06A):176-179. 被引量：3
8陶运信,皮德常.一种快速移动对象轨道聚类算法[J].高技术通讯,2010,20(1):99-105.
9谢洪,吴博义,赵展.一种新的海量点云数据管理方法研究[J].遥感信息,2013,28(6):26-32. 被引量：11
10牟廉明.选择性自适应k子凸包分类方法[J].南京大学学报（自然科学版）,2013,49(4):411-417. 被引量：2

南京邮电学院学报（自然科学版）

2005年第4期

浏览历史

内容加载中请稍等...

一种简单有效的基于密度的聚类分析算法被引量：8

参考文献8

二级参考文献6

共引文献41

同被引文献65

引证文献8

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

一种简单有效的基于密度的聚类分析算法 被引量：8

参考文献8

二级参考文献6

共引文献41

同被引文献65

引证文献8

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

一种简单有效的基于密度的聚类分析算法被引量：8