基于模糊邻域的比较密度峰值算法

Clustering by Comparitive Density Peaks Using Fuzzy Neighborhood

下载PDF

导出

摘要聚类作为机器学习中一种重要的无监督学习方式,在图像处理及生物基因分类上具有广泛的应用。快速密度峰搜索与聚类算法(DPC)提出通过寻找密度峰对数据进行分类,它既不需要迭代过程,也不需要人工输入太多参数。但在球形数据集上,DPC算法聚类效果不好,容易忽略潜在的聚类中心,需要人工参与聚类中心选取。针对上述问题,本文采用模糊邻域关系计算数据密度,采用比较距离代替DPC算法中的相对距离。通过对机器学习数据集的实验,将本文提出的算法同DBSCN、OPTICS、DPC在准确率和调整兰德系数上进行比较。实验结果表明本文提出的算法可行有效。 As an important unsupervised learning method in machine learning, clustering has a wide range of applications in image processing and biological gene classification. "Clustering by fast search and find of density peaks"(DPC) proposes to classify data by looking for density peaks, which does not require an iterative process or too many input arguments. However, the DPC algorithm performs poorly on the spherical dataset, and it is easy to ignore the potential cluster center, and needs to manually participate in the cluster center selection. In view of the above problems, this paper uses the fuzzy neighborhood relationship to calculate the data density, and uses the comparative distance instead of the relative distance in the DPC algorithm. Through the experiment of machine learning data set, we compared our algorithm with DBSCAN, OPTICS and DPC in terms of accuracy and ARI. The experimental results show that the proposed algorithm is feasible and effective.

作者李昕雷迎科 Li Xin;Lei Yingke(Electronic Countermeasures Institution of National University of Defense Technology,Hefei,Anhui 230037,China)

机构地区国防科技大学电子对抗学院

出处《信号处理》 CSCD 北大核心 2019年第11期1919-1928,共10页 Journal of Signal Processing

关键词无监督机器学习密度峰值聚类算法模糊聚类算法比较距离 unsupervised machine learning density peak clustering algorithm fuzzy clustering algorithm comparitive distance

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1肖宇,于剑.基于近邻传播算法的半监督聚类[J].软件学报,2008,19(11):2803-2813. 被引量：165
2谢文斌,童楠,王忠秋,贾官洪,陈维奇,符强.基于粒子群的近邻传播算法[J].计算机系统应用,2014,23(3):103-107. 被引量：6
3蔡元萃,陈立潮.聚类算法研究综述[J].科技情报开发与经济,2007,17(1):145-146. 被引量：21
4任新维,张桂珠.融合密度峰值和模糊C-均值聚类算法[J].传感器与微系统,2018,37(3):145-147. 被引量：7
5刘沧生,许青林.基于密度峰值优化的模糊C均值聚类算法[J].计算机工程与应用,2018,54(14):153-157. 被引量：15
6张麟,潘红岩.聚类分析算法应用研究[J].数字技术与应用,2016,34(10):143-143. 被引量：5
7李明华,刘全,刘忠,郗连霞.数据挖掘中聚类算法的新发展[J].计算机应用研究,2008,25(1):13-17. 被引量：50
8邱保志,唐雅敏.快速识别密度骨架的聚类算法[J].计算机应用,2017,37(12):3482-3486. 被引量：5

二级参考文献91

1刘静,钟伟才,刘芳,焦李成.免疫进化聚类算法[J].电子学报,2001,29(z1):1868-1872. 被引量：43
2刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005,25(6):54-58. 被引量：122
3张建华,江贺,张宪超.蚁群聚类算法综述[J].计算机工程与应用,2006,42(16):171-174. 被引量：41
4张丽娟,李舟军.分类方法的新发展:研究综述[J].计算机科学,2006,33(10):11-15. 被引量：20
5陈松生,王蔚.改进的快速模糊C-均值聚类算法[J].计算机工程与应用,2007,43(10):167-169. 被引量：13
6许雷.一种聚类新算法:模拟退火[J].模式识别与人工智能,1989,1:1-16. 被引量：3
7GUHA S,RASTOGI R,SHIM K.CURE:an efficient clustering algorithm for large databases[C]//HAAS L M,TIVARY A.Proc of ACM SIGMOD International Conference on Management of Data.Seattle:ACM Press,1998:73-84. 被引量：1
8KRISHNA K,MURTY M N.Genetic K-means algorithm[J].IEEE Trans on System,Man,and Cybernetics:Part B,1999,29(3):433-439. 被引量：1
9CHINRUNGRUENG C,SEQUIN C H.Optimal adaptive K-means algorithm with dynamic adjustment of learning rate[J].IEEE Trans on Neural Networks,1995,6(1):157-169. 被引量：1
10LEE D,BACK S,SUNG K.Modified K-means algorithm for vector quantizer design[J].IEEE Signal Processing Letters,1997,4(l):2-4. 被引量：1

共引文献263

1褚娜,马利庄,王彦.聚类趋势问题的研究综述[J].计算机应用研究,2009,26(3):801-803. 被引量：6
2任惠琳.商业企业营销数据挖掘及营销数据统计分析系统的有效构建[J].现代商业,2013(31):162-163. 被引量：5
3常瑞花.基于密集度量元的近邻传播聚类算法[J].微电子学与计算机,2015,32(5):1-5. 被引量：1
4田华阁,池占胜,田学民.一种聚类加权支持向量机算法及其在软测量中的应用[J].计算机与应用化学,2008,25(7):907-909. 被引量：2
5王安志,李明东,李超.各种聚类算法及改进算法的研究[J].电脑知识与技术,2008,3(9):1539-1541. 被引量：7
6陈炎龙,段红玉.利用数据挖掘技术提高自动排课合理性的研究[J].农业网络信息,2009(4):22-24.
7钱强,李英.数据挖掘技术在图书馆读者分析中的应用[J].图书情报工作,2009,53(12):121-124. 被引量：24
8雷宏,张著洪.受约束的两类数据分割算法及其应用[J].贵州大学学报（自然科学版）,2009,26(2):85-89.
9杨柳,钟诚,陆向艳.基于P2P网络的分布式聚类算法研究分析[J].微电子学与计算机,2009,26(8):83-85. 被引量：2
10庞春江,程伟想,牛为华.基于优化网格的最小生成树聚类算法[J].计算机应用与软件,2009,26(8):262-264.

1金华频,杨佳.基于移动互联网的农村水电数据采集系统应用及研究[J].小水电,2019,0(6):53-55. 被引量：1
2邱生林,刘成忠.基于GPU的FOA的并行计算在基因分类中的应用[J].信息通信,2019,0(9):270-271.
3林玉竹.基于Python OpenCV的人脸识别超市会员系统[J].信息周刊,2019,0(46):0089-0090.
4樊延家.CYP2C19基因多态性对冠心病患者PCI术后抗凝治疗的指导作用[J].淮海医药,2019,37(6):578-580.
5梁俊杰,韦舰晶,蒋正锋.生成对抗网络GAN综述[J].计算机科学与探索,2020,14(1):1-17. 被引量：72
6林龙成.基于遗传算法的改进K-means算法[J].电子技术与软件工程,2020(1):111-112. 被引量：1
7王弘扬.基于出租车运营数据的载客区域聚类及热点特征分析[J].数据挖掘,2020,10(1):39-46.
8李存志,钱萌,孟金彪.基于核极限学习机自编码多标记学习[J].数字通信世界,2019,0(12):242-243.
9Si-Bo Hao,Zi-Li Zhang,Yuan-Yuan Ma,Meng Yu Chen,Yang Liu,Hao-Chong Huang,Zhi-Yuan Zheng.Terahertz Lens Fabricated by Natural Dolomite[J].Chinese Physics Letters,2019,36(12):40-42. 被引量：4
10雷柏伟,吴兵.翻转课堂在安全生产与消防法规中的应用[J].大学教育,2020,0(1):60-63.

信号处理

2019年第11期

浏览历史

内容加载中请稍等...

基于模糊邻域的比较密度峰值算法

参考文献8

二级参考文献91

共引文献263

相关作者

相关机构

相关主题

浏览历史