基于KD树改进的DBSCAN聚类算法被引量：10

Improved DBSCAN Clustering Algorithm Based on KD Tree

下载PDF

导出

摘要针对DBSCAN聚类算法随着数据量增大,耗时越发非常严重的问题,提出一种基于KD树改进的DBSCAN算法(以下简称KD-DBSCAN).通过KD树对数据集进行划分,构造邻域对象集,提前区分出噪声点和核心点,避免聚类过程中对噪声的邻域集计算以及加快了核心点对象的邻域集查询速度.文中以浮动车GPS数据为实验数据,对比传统DBSCAN算法和KD-DBSCAN算法的聚类效果和时间性能,实验结果表明KD-DBSCAN算法的聚类效果和传统的DBSCAN基本一致,但时间性能有很大的提升. To tackle the problem that density-based spatial clustering of applications with noise(DBSCAN)clustering algorithm is increasingly time-consuming with the increase in data volume,this study proposes an improved DBSCAN algorithm based on a K-dimensional(KD)tree(hereinafter referred to as KD-DBSCAN).The KD tree is used to divide the data set,construct the neighborhood object set,and distinguish the noise point and the core point in advance to avoid the calculation of the noise neighborhood set in the clustering process and speed up the neighborhood set query of the core point object.In this study,the global positioning system(GPS)data of a floating car is used as experimental data to compare the traditional DBSCAN algorithm and KD-DBSCAN algorithm in aspects of the clustering effect and time performance.The experimental results show that the KD-DBSCAN algorithm is comparable to the traditional DBSCAN algorithm in the clustering effect but has greatly improved time performance.

作者陈文龙时宏伟 CHEN Wen-Long;SHI Hong-Wei(College of Computer Science,Sichuan University,Chengdu 610065,China)

机构地区四川大学计算机学院

出处《计算机系统应用》 2022年第2期305-310,共6页 Computer Systems & Applications

关键词聚类 DBSCAN算法 KD树 clustering density-based spatial clustering of applications with noise(DBSCAN)algorithm KD tree

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1070
2Yuwei WANG,Yuanchun ZHOU,Ying LIU,Ze LUO,Danhuai GUO,Jing SHAO,Fei TAN,Liang WU,Jianhui LI,Baoping YAN.A grid-based clustering algorithm for wild bird distribution[J].Frontiers of Computer Science,2013,7(4):475-485. 被引量：4
3王桂芝,王广亮.改进的快速DBSCAN算法[J].计算机应用,2009,29(9):2505-2508. 被引量：24
4许虎寅,王治和.一种改进的基于密度的聚类算法[J].微电子学与计算机,2012,29(2):44-47. 被引量：20
5安计勇,韩海英,侯效礼.一种改进的DBscan聚类算法[J].微电子学与计算机,2015,32(7):68-71. 被引量：13
6彭波,史春雷,高万林.DBSCAN算法优化及在村镇管理决策中的应用[J].农业机械学报,2016,47(10):346-350. 被引量：1
7冯振华,钱雪忠,赵娜娜.Greedy DBSCAN:一种针对多密度聚类的DBSCAN改进算法[J].计算机应用研究,2016,33(9):2693-2696. 被引量：45
8刘勇,何婧,姚绍文,向毅,张浩.基于重心点转移的St-DBSCAN改进算法[J].计算机技术与发展,2018,28(11):6-11. 被引量：1
9冯柳伟,常冬霞,邓勇,赵耀.最近最远得分的聚类性能评价指标[J].智能系统学报,2017,12(1):67-74. 被引量：8

二级参考文献99

1张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
2李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
3李杰,贾瑞玉,张璐璐.一个改进的基于DBSCAN的空间聚类算法研究[J].计算机技术与发展,2007,17(1):114-116. 被引量：13
4CHEN M S, HAN J H, YU P S. Data mining: An overview from a database perspective [ J]. IEEE Transactions on Knowledge and Data Engineering, 1996, 8(6): 866 -883. 被引量：1
5KAUFAN L, RPUSSEEUW P J. Finding groups in data: An introduction to cluster analysis [ M]. New York: John Wiley & Sons, 1990. 被引量：1
6ESTER M, KRIEGEL H P, XU X W. Knowledge discovery in large SPATIAL database: Focusing techniques for efficient class identification [ C]//Proceedings of the 4th International Symposium on Advances in Spatial Databases, LNCS 951. London: Springer-Verlag, 1995:67-82. 被引量：1
7ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial database with noise [ C]//KDD - 96: Proceedings of the 2nd International Conference on Knowledge Discovering and DataMining. Portland, Oregon: [ s. n.], 1996:226-231. 被引量：1
8GUHA S, RASTOGI R, SHIM K. CURE: An efficient clustering algorithm for large databases [ C]// Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data. New York: ACM Press, 1998:73-84. 被引量：1
9AGRAWAL R, GEHRKE J, GUNOPOLOS D, et al. Automatic subspace clustering of high dimensional data for data mining application [C]// Proceedings of the ACM SIGMOD International Conference on Very Large Data Bases. Roma: Morgan Kaufmann Publishers, 2001:331-340. 被引量：1
10ALEXANDROS N, YANNIS T, YANNIS M. C2P: Clustering based on closest pairs [ C]//Proceedings of the 27th International Conference on Very Large Databases. Roma: Morgan Kaufmann Publishers, 2001:331-340. 被引量：1

共引文献1164

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3杨然,王虹,孙传波,余国才.基于因子图优化的DBSCAN聚类组合导航算法[J].微波学报,2023,39(S01):409-413.
4林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
5高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
6毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
7张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
8李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
9尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
10侯冀超,谢成心,孟凡兴,温秀梅.基于模糊聚类处理月亮型数据的研究与实现[J].河北建筑工程学院学报,2022,40(3):173-178.

同被引文献84

1张浩,左杭,刘宝华.视觉与二维激光雷达的目标检测方法[J].电子测量与仪器学报,2022,36(3):79-86. 被引量：13
2薛丁文,李建中.基于KD树的k-means聚类算法优化[J].智能计算机与应用,2021,11(11):194-197. 被引量：6
3李青云,曾钢,伍翼.校正坡度地面点云分割研究[J].国外电子测量技术,2022,41(2):117-121. 被引量：4
4李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34. 被引量：893
5周董,刘鹏.VDBSCAN:变密度聚类算法[J].计算机工程与应用,2009,45(11):137-141. 被引量：21
6陈白帆,蔡自兴,潘薇.基于声纳和摄像头的动态环境地图创建方法[J].高技术通讯,2009,19(4):410-414. 被引量：3
7清华大学软件学院BIM课题组.中国建筑信息模型标准框架研究[J].土木建筑工程信息技术,2010,2(2):1-5. 被引量：104
8黎运发,黄名辉.核密度估计逐点最优窗宽选择的改进[J].统计与决策,2011,27(14):28-32. 被引量：7
9陈强璋.一种高效的二叉查找树——红黑树[J].华东师范大学学报（自然科学版）,2000(3):39-42. 被引量：6
10朱丹,李连登,童艳.外测实时数据融合算法应用研究[J].测控技术,2014,33(3):56-58. 被引量：7

引证文献10

1刘永超,刘秀文,谢兴涛,栾鑫.基于激光雷达的港口环境海面目标检测[J].电子测量技术,2023,46(6):153-158. 被引量：1
2李嘉位,马为红,李奇峰,薛向龙,WANG Zhiquan.复杂环境下肉牛三维点云重建与目标提取方法[J].智慧农业（中英文）,2022,4(2):64-76. 被引量：3
3陶鹤丹,项树林,吴诗帆.自适应DBSCAN算法在快速落点预报中的应用研究[J].舰船电子工程,2023,43(2):84-88.
4李泽宇,赵志刚,万远,陈俊杰,徐海.面向BIM构件实例模型的层次聚类方法研究[J].测绘科学,2023,48(3):146-154. 被引量：3
5李庆玲,郭鸿锐,蔡轩,胡一鸣,李睿哲.一种激光三维点云动态障碍剔除算法框架[J].实验技术与管理,2023,40(7):56-62. 被引量：2
6谭志锋,姬联涛,荆岫岩,王璞,田海平.基于KD-Tree与DBSCAN的水电机组状态监测数据清洗方法[J].中国农村水利水电,2024(3):250-254.
7王红林,李忠伟.大数据场景下用户评论聚类文本挖掘算法[J].计算机仿真,2024,41(3):352-358.
8葛程鹏,赵东,王蕊,马庆华.基于改进DBSCAN和距离共识评估的分段点云去噪方法[J].系统仿真学报,2024,36(8):1800-1809.
9赵雅丽,郭鹏,胡乾坤,董科韬.基于云模型的风电机组出力异常监测方法[J].电力科学与工程,2024,40(8):70-78.
10邱绍强,鄢曙光.基于数字孪生和聚类算法的采煤机数据异常识别研究[J].软件工程与应用,2024,13(3):384-391.

二级引证文献9

1叶文帅,康熙,贺志将,李孟飞,刘刚.基于深度图像的多姿态肉牛体尺自动测量方法[J].智慧农业（中英文）,2022,4(4):144-155. 被引量：3
2李忠慧,刘晨曦,马为红,邓凯平,陈善元,连正兴,张文广,刘志红,李文蓉.绵羊和山羊肉用性能表型鉴定研究现状与展望[J].中国科学：生命科学,2023,53(7):989-1001. 被引量：2
3罗扬静,夏添,丁勇,王海涛.基于GPU并行分块的二维恒虚警检测算法的实现方法[J].国外电子测量技术,2023,42(10):12-18.
4金伟正,孙原,李方玉.基于多分支特征融合的车载激光雷达3D目标检测算法[J].实验技术与管理,2024,41(1):37-43.
5康胜霞.BIM技术在管道预制加工中的运用[J].建筑,2024(5):121-123.
6贺彪,唐骜巍,蒯希,徐海,肖佳栋.融合IFC语义信息与几何相似性的BIM构件实例信息提取方法[J].测绘通报,2024(5):96-102.
7王永安.信息化技术在机电设备安装工程中的应用[J].造纸装备及材料,2024,53(3):104-106.
8赵师兵,张志明,康琦,张军旗.室内移动机器人激光点云2D墙线检测实验[J].实验技术与管理,2024,41(5):76-81.
9王玲,贺少鹏,蒋瑞瑞,杨秋雨.基于射频识别技术的笼养雏鸡运动监测研究[J].中国家禽,2024,46(8):107-113.

1张梦园,彭定涛,胡殿涛.基于改进密度聚类的用气异常检测[J].应用数学进展,2021,10(11):3952-3961.
2孟文君,李杰,张凯,刘长达,唐秋华.基于改进DBSCAN算法的ICESat-2海面点数据去噪处理及精度评估[J].海洋通报,2021,40(6):675-682. 被引量：4

计算机系统应用

2022年第2期

浏览历史

内容加载中请稍等...

基于KD树改进的DBSCAN聚类算法被引量：10

参考文献9

二级参考文献99

共引文献1164

同被引文献84

引证文献10

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于KD树改进的DBSCAN聚类算法 被引量：10

参考文献9

二级参考文献99

共引文献1164

同被引文献84

引证文献10

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于KD树改进的DBSCAN聚类算法被引量：10