自然反向最近邻优化的密度峰值聚类算法被引量：11

Optimized Density Peak Clustering Algorithm by Natural Reverse Nearest Neighbor

下载PDF

导出

摘要密度峰值聚类算法是一种基于密度的聚类算法。针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提出一种新的密度峰值聚类算法,该算法基于自然反向最近邻结构。首先,该算法引入反向最近邻计算数据对象的局部密度;其次,通过代表点和密度相结合的方式选取初始聚类中心;然后,应用密度自适应距离计算初始聚类中心之间的距离,利用基于反向最近邻计算出的局部密度和密度自适应距离在初始聚类中心上构建决策图,并通过决策图选择最终的聚类中心;最后,将剩余的数据对象分配到距离其最近的初始聚类中心所在的簇中。实验结果表明,该算法在合成数据集和UCI真实数据集上与实验对比算法相比较,具有较好的聚类效果和准确性,并且在处理复杂流形数据上的优越性较强。 The density peak clustering algorithm is a density based clustering algorithm.The shortcomings of the density peak clustering algorithm are sensitive to parameters and poor clustering results on complex manifold data sets.A novel density peak clustering algorithm is proposed in this paper,which is based on the natural reverse nearest neighbor structure.First of all,reverse nearest neighbor is introduced to calculate the local density of data objects.Then,the initial cluster centers are selected by combining the representative points and the density.Furthermore,the density adaptive distance is used to calculate the distance between the initial cluster centers,the decision graph is constructed on the initial cluster centers by using the local density calculated based on reverse nearest neighbor and the density adaptive distance,and the final cluster centers are selected according to the decision graph.Finally,the remaining data objects are assigned to the same cluster as their nearest initial cluster centers belong to.The experimental results show that the algorithm has better clustering effect and accuracy compared with the experimental comparison algorithms on the synthetic data sets and UCI real data sets,and it has greater advantages in dealing with complex manifold data sets.

作者刘娟万静 LIU Juan;WAN Jing(College of Computer Science and Technology,Harbin University of Science and Technology,Harbin 150080,China)

机构地区哈尔滨理工大学计算机科学与技术学院

出处《计算机科学与探索》 CSCD 北大核心 2021年第10期1888-1899,共12页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金(61872105) 黑龙江省教育厅科学技术研究项目(12531z004)。

关键词自然邻居反向最近邻代表点局部密度聚类 natural neighbor reverse nearest neighbor representative points local density clustering

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1陈叶旺,申莲莲,钟才明,王田,陈谊,杜吉祥.密度峰值聚类算法综述[J].计算机研究与发展,2020,57(2):378-394. 被引量：47
2杜沛,程晓荣.一种基于K近邻的比较密度峰值聚类算法[J].计算机工程与应用,2019,55(10):161-168. 被引量：12
3金辉,钱雪忠.自然最近邻优化的密度峰值聚类算法[J].计算机科学与探索,2019,13(4):711-720. 被引量：22
4贾露,张德生,吕端端.物理学优化的密度峰值聚类算法[J].计算机工程与应用,2020,56(13):47-53. 被引量：14
5丁志成,葛洪伟.优化分配策略的密度峰值聚类算法[J].计算机科学与探索,2020,14(5):792-802. 被引量：7
6周洁,姜志彬,张远鹏,王士同.基于密度的模糊代表点聚类算法[J].控制与决策,2020,35(5):1123-1133. 被引量：10

二级参考文献20

1冯少荣,肖文俊.一种提高DBSCAN聚类算法质量的新方法[J].西安电子科技大学学报,2008,35(3):523-529. 被引量：13
2杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
3王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(3):321-328. 被引量：194
4李宁,朱青.大数据模式分解的隐私保护研究[J].计算机科学与探索,2012,6(11):961-973. 被引量：4
5黄敏,饶明雷,李敏.面向仿真的车道级基础路网模型及其应用[J].系统仿真学报,2014,26(3):657-661. 被引量：15
6钱卫宁,周傲英.从多角度分析现有聚类算法(英文)[J].软件学报,2002,13(8):1382-1394. 被引量：86
7王杰,梁吉业,郑文萍.一种面向蛋白质复合体检测的图聚类方法[J].计算机研究与发展,2015,52(8):1784-1793. 被引量：14
8Ziling Pang,Guoyin Wang,Jie Yang.A Multi-granularity Decomposition Mechanism of Complex Tasks Based on Density Peaks[J].Big Data Mining and Analytics,2018,1(3):245-256. 被引量：3
9谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
10WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：62

共引文献95

1侯冀超,谢成心,孟凡兴,温秀梅.基于模糊聚类处理月亮型数据的研究与实现[J].河北建筑工程学院学报,2022,40(3):173-178.
2李泰,韩强,黄银龙,王宗宏.基于kNN算法的红外测温图谱的温度数字识别研究[J].电力信息与通信技术,2019,17(6):14-19. 被引量：6
3聂启阳,朱峰.基于fastMCD和DBSCAN的公车私用监管模型[J].技术与市场,2019,26(10):176-180.
4何云斌,董恒,万静,李松.基于密度峰值和近邻优化的聚类算法[J].计算机科学与探索,2020,14(4):554-565. 被引量：7
5邓然然,李伟,杨荣新.自调节步长果蝇优化的自适应密度峰值聚类[J].计算机系统应用,2020,29(4):126-136. 被引量：4
6康雷雷,卢维科,刘澜.城市快速路入口匝道与交叉口协调控制策略[J].计算机工程与应用,2020,56(9):267-271. 被引量：6
7丁志成,葛洪伟.优化分配策略的密度峰值聚类算法[J].计算机科学与探索,2020,14(5):792-802. 被引量：7
8谭阳,唐德权,曹守富.聚类混合型数据的密度峰值改进算法[J].计算机工程与应用,2020,56(12):47-53. 被引量：1
9贾露,张德生,吕端端.物理学优化的密度峰值聚类算法[J].计算机工程与应用,2020,56(13):47-53. 被引量：14
10罗浩,王彦捷,牛明航,邱存月,张利.动态区间的加权模糊聚类算法[J].计算机科学与探索,2020,14(7):1142-1153. 被引量：5

同被引文献69

1孙伟鹏,吴锡生,孟斌.基于Spark并行的密度峰值聚类算法[J].计算机应用研究,2020,37(1):163-166. 被引量：2
2邵长高,谭建军,荆丽梅,冯徽徽,孙芹芹.海洋小比例尺地图精确测量及计算方法[J].地理与地理信息科学,2009,25(2):42-45. 被引量：5
3靳延安,刘行军.一种改进的层次聚类算法[J].武汉理工大学学报（信息与管理工程版）,2011,33(6):883-886. 被引量：4
4杜欣,刘大刚,倪友聪,张开活,谢大同.一种新的并行自动聚类算法:CGC-Cluster[J].小型微型计算机系统,2015,36(6):1181-1187. 被引量：2
5WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：62
6许朝阳,林耀海,张萍.基于密度二分法的密度峰值聚类方法[J].计算机工程与应用,2018,54(12):138-145. 被引量：4
7鲍舒婷,孙丽萍,郑孝遥,郭良敏.基于共享近邻相似度的密度峰聚类算法[J].计算机应用,2018,38(6):1601-1607. 被引量：8
8刘沧生,许青林.基于密度峰值优化的模糊C均值聚类算法[J].计算机工程与应用,2018,54(14):153-157. 被引量：15
9高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22
10冯骥,张程,朱庆生.一种具有动态邻域特点的自适应最近邻居算法[J].计算机科学,2017,44(12):194-201. 被引量：4

引证文献11

1赵力衡,王建,陈虹君.去中心化加权簇归并的密度峰值聚类算法[J].计算机科学与探索,2022,16(8):1910-1922. 被引量：3
2李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：1
3刘学文,王继奎,杨正国,李冰,聂飞平.密度峰值隶属度优化的半监督Self-Training算法[J].计算机科学与探索,2022,16(9):2078-2088. 被引量：2
4宋鹏,葛洪伟.最近邻的密度峰值聚类标签传播算法[J].计算机科学与探索,2022,16(12):2809-2819. 被引量：1
5王森,邢帅杰,刘琛.密度峰值聚类算法研究综述[J].华东交通大学学报,2023,40(1):106-116. 被引量：2
6郑帅,杨雪纯,海丹凤.基于改进密度峰值聚类算法的低占用率云调度容错控制模型研究[J].桂林航天工业学院学报,2023,28(3):400-405.
7龙建武,王强.反向近邻构造连通图的聚类算法[J].计算机科学与探索,2023,17(11):2651-2662.
8陈迪,杜韬,周劲,仵匀政,王心耕.自适应多密度峰值子簇融合聚类算法[J].计算机工程与应用,2023,59(23):73-85.
9张紫丹,徐华,杨重阳.二阶自然最近邻和多簇合并的密度峰值聚类算法[J].计算机应用研究,2023,40(12):3559-3565.
10王骊,翁慧颖,孙小江.基于图注意力机制的车辆路径问题研究[J].信息技术与信息化,2024(2):122-125.

二级引证文献9

1丁竹娴,周立军,樊江川,安锋,陈帮乾,王铭慧,蒋玲,薛联凤,云挺.基于深度学习与激光点云的橡胶林枝干重建及参数反演[J].农业工程学报,2022,38(8):187-199. 被引量：3
2王艺霖,肖媛媛,左鹏飞,杨博,刘悦霞,段宗涛.基于改进聚类算法的交通事故多发点识别方法[J].计算机应用研究,2023,40(10):2993-2999.
3周浩岩,叶军,谢立,卢岚,李兆彬.基于果蝇算法优化的粗糙C均值聚类算法[J].南昌工程学院学报,2023,42(4):79-86.
4梁灯,蔡晓禹,彭博,邢茹茹.基于改进K-prototypes与GBDT的城市干道车辆出行群体辨识模型[J].华东交通大学学报,2023,40(5):49-58.
5陈迪,杜韬,周劲,仵匀政,王心耕.自适应多密度峰值子簇融合聚类算法[J].计算机工程与应用,2023,59(23):73-85.
6白丹丹,刘宜成,周树桥,涂海燕.去中心化分布式控制系统设计研究[J].组合机床与自动化加工技术,2024(3):87-91.
7谢娟英,张文杰.局部标准差优化的密度峰值聚类算法[J].陕西师范大学学报（自然科学版）,2024,52(3):47-62.
8韩运龙,尚庆生,赵薇,郭泓.结合密度峰值和集成过滤器的自训练算法[J].宜宾学院学报,2024,24(6):15-20.
9吕佳,邱鸿波,肖锋.基于动态阈值和差异性检验的自训练算法[J].智能系统学报,2024,19(4):839-852.

1张瑾,曲东,任晓旭,刘谷月,吴雅慧.高频振荡通气与常规机械通气治疗婴幼儿重症呼吸道合胞病毒肺炎的随机对照研究[J].中华危重病急救医学,2021,33(4):455-459. 被引量：11
2江文奇,黄容,牟华伟,袁亚纯.面向大规模数据精简的聚类中心点优化和FCM算法设计[J].数学的实践与认识,2021,51(17):144-151. 被引量：5
3杜淑颖,施天豪,丁世飞.基于电子分层模型和凝聚策略的密度峰值聚类[J].南京理工大学学报,2021,45(4):385-393. 被引量：1
4杨朝军,应泽林,陈飞.绍兴平原河网引水工程精确引水方案研究[J].浙江水利水电学院学报,2021,33(4):20-26. 被引量：4
5祝嘉翀,黄天立,周朝阳,徐步齐.高铁大跨拱承式独塔斜拉桥成桥状态力学参数敏感性分析[J].铁道科学与工程学报,2021,18(9):2244-2254. 被引量：4

计算机科学与探索

2021年第10期

浏览历史

内容加载中请稍等...

自然反向最近邻优化的密度峰值聚类算法被引量：11

参考文献6

二级参考文献20

共引文献95

同被引文献69

引证文献11

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

自然反向最近邻优化的密度峰值聚类算法 被引量：11

参考文献6

二级参考文献20

共引文献95

同被引文献69

引证文献11

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

自然反向最近邻优化的密度峰值聚类算法被引量：11