二分k-means锚点提取的快速谱聚类被引量：4

Fast Spectral Clustering Based on Anchor Point Extraction with Bisecting k-means

下载PDF

导出

摘要光谱聚类(spectral clustering,SC)由于在无监督学习中的有效性而受到越来越多的关注。然而其计算复杂度高,不适用于处理大规模数据。近年来提出了许多基于锚点图方法来加速大规模光谱聚类,然而这些方法选取的锚点通常不能很好地体现原始数据的信息,从而导致聚类性能下降。为克服这些缺陷,提出了一种二分k-means锚点提取的快速谱聚类算法(fast spectral clustering algorithm based on anchor point extraction with bisecting kmeans,FCAPBK)。该方法利用二分k-means从原始数据中选取一些具有代表性的锚点,构建基于锚点的多层无核相似图;然后通过锚点与样本间的相似关系构造层次二部图。最后在5个基准数据集上分别进行实验验证,结果表明FCAPBK方法能够在较短的时间内获得良好的聚类性能。 Spectral clustering(SC)has received increasing attention due to its effectiveness in unsupervised learning.However,due to its high computational complexity,it is not suitable for processing large-scale data.In recent years,many anchor points graph-based methods have been proposed to accelerate large-scale spectral clustering.However,the anchor points selected by these methods usually cannot well reflect the information of the original data,which leads to the degradation of clustering performance.To overcome these shortcomings,a fast spectral clustering algorithm based on anchor point extraction with bisecting k-means(FCAPBK)is proposed.The method uses bisecting k-means to select some representative anchor points from the original data,then constructs a multi-layer kernel-free similarity graph based on anchor points,and constructs a hierarchical bipartite graphs through the similar relationship between the anchor points and the sample.Finally,experiments are carried out on five benchmark datasets,and the results show that the FCAPBK method can obtain good clustering performance in a short time.

作者罗兴隆贺兴时杨新社 LUO Xinglong;HE Xingshi;YANG Xinshe(College of Science,Xi’an Polytechnic University,Xi’an 710600,China;College of Science and Technology,Middlesex University,London NW44BT,UK)

机构地区西安工程大学理学院密德萨斯大学科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2023年第16期74-81,共8页 Computer Engineering and Applications

基金国家自然科学基金(12101477) 陕西省自然科学基础研究计划(2020JQ-831)。

关键词二分k-means 二部图锚点图谱聚类 bisecting k-means bipartite graphs anchor points spectral clustering

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1左进,陈泽茂.基于改进K均值聚类的异常检测算法[J].计算机科学,2016,43(8):258-261. 被引量：51

二级参考文献4

1江敏,皮德常,孙兰.一种多约束的密度聚类算法的研究[J].计算机科学,2011,38(B10):143-145. 被引量：3
2付迎丁,兰巨龙.基于核自适应的近邻传播聚类算法[J].计算机应用研究,2012,29(5):1644-1647. 被引量：9
3孙娜,郭延锋,姚远.增量式SVM的数据流异常检测模型[J].计算机工程与应用,2012,48(29):78-81. 被引量：2
4韩最蛟.基于数据密集性的自适应K均值初始化方法[J].计算机应用与软件,2014,31(2):182-187. 被引量：20

共引文献50

1李飞谷,张玉香,朱峰波,温良涛.提高地方煤质数据库应用价值的途径[J].中国科技纵横,2018,0(17):167-168. 被引量：1
2冯小芹,何宏,胡晓辉,孙晨旭,向朝参,喻赛萱.基于K-means聚类的大学生综合素质评定方法[J].重庆理工大学学报（自然科学）,2017,31(5):125-132. 被引量：4
3符运阳,郭胜娜,王兵,王光光.基于LAB颜色空间的植物病变区域提取[J].电子世界,2017,0(20):105-106. 被引量：4
4王惠杰,王雷雨.基于正反平衡校验的入炉煤质在线监测[J].电力科学与工程,2017,33(10):40-44. 被引量：3
5郑德俊,朱婷婷,沈军威.基于改进K均值算法的移动图书馆用户评论需求聚类研究[J].数字图书馆论坛,2017(10):26-31. 被引量：2
6贾晓婷,王名扬,曹宇.结合Doc2Vec与改进聚类算法的中文单文档自动摘要方法研究[J].数据分析与知识发现,2018,2(2):86-95. 被引量：20
7吴清寿,刘耿耿,郭文忠.基于部分实例重判的二分K-means算法[J].福州大学学报（自然科学版）,2018,46(3):317-323. 被引量：1
8贡晓静.基于改进关联聚类的光纤网络异常数据隔离算法[J].激光杂志,2018,39(8):193-196. 被引量：4
9柳兆峰,杨奇,霍永华,谢志敏.基于CURE聚类算法的科技情报异常数据检测[J].无线电通信技术,2018,44(6):605-609. 被引量：3
10高荣芳,董振涛,夏海洋.基于采样的超球体聚类离群点检测算法[J].中北大学学报（自然科学版）,2018,39(5):536-541. 被引量：3

同被引文献33

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1079
2刘倩颖,阮应君,时翔,李铮伟.基于kmeans聚类与BP神经网络算法的办公建筑逐时电负荷预测[J].热能动力工程,2018,33(3):138-144. 被引量：33
3于彦伟,贾召飞,曹磊,赵金东,刘兆伟,刘惊雷.面向位置大数据的快速密度聚类算法[J].软件学报,2018,29(8):2470-2484. 被引量：32
4钟熙,孙祥娥.基于Kmeans++聚类的朴素贝叶斯集成方法研究[J].计算机科学,2019,46(B06):439-441. 被引量：27
5王万丰(文/图).我国道路交通安全事故统计分析[J].中国安全生产,2020,0(3):52-53. 被引量：8
6刘君,王学伟.基于YOLO的番茄病虫害识别算法[J].中国瓜菜,2020,33(9):18-22. 被引量：32
7张志勇,路小娟,孔令刚,范多进,姚小明.K-means结合RBF神经网络预测线性菲涅尔集热回路出口熔盐温度[J].农业工程学报,2021,37(3):213-222. 被引量：4
8李旻,何婷婷.基于随机数三角阵映射的高维大数据二分聚类初始中心高效鲁棒生成算法[J].电子与信息学报,2021,43(4):948-955. 被引量：7
9陆佳炜,吴涵,张元鸣,梁倩卉,肖刚.融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法[J].计算机学报,2021,44(7):1501-1515. 被引量：9
10江文奇,黄容,牟华伟,袁亚纯.面向大规模数据精简的聚类中心点优化和FCM算法设计[J].数学的实践与认识,2021,51(17):144-151. 被引量：5

引证文献4

1岳珊,雍巧玲.基于确定初始簇心的优化K-means算法[J].数字技术与应用,2023,41(11):140-142. 被引量：3
2宋月亭,卢巍.基于K-means的驾驶行为离散化特征聚类分析与研究[J].现代信息科技,2024,8(2):17-20.
3郭小燕,于帅卿.一种轻量级YOLOv5S农作物虫害目标检测模型[J].南京农业大学学报,2024,47(5):1009-1018. 被引量：1
4关梅,冯宝珠,胡超.基于信息挖掘的计算机通信网络异常流量节点检测算法[J].新乡学院学报,2024,41(9):46-51.

二级引证文献4

1李明峰,冯鑫,檀丁.基于K-means的多级迭代分区坐标转换方法研究[J].现代测绘,2024,47(1):1-3.
2李红仁,张坤,王鑫,呼树尧,马吉伟.基于历史数据的燃气轮机健康状态实时评估系统[J].电力大数据,2024,27(4):63-71. 被引量：1
3化春键,宋一鸣,蒋毅,俞建峰,陈莹.融合超绿通道的低辨识度草坪杂草识别算法[J].东北农业大学学报,2024,55(7):83-92.
4李春霞.K-means算法在学生能力评估中的应用[J].兰州文理学院学报（自然科学版）,2024,38(6):51-54.

1樊娟,邓秀勤,刘玉兰.一种基于Fréchet距离的谱聚类算法[J].广东工业大学学报,2023,40(2):39-44.
2高世宝.带你解惑结构保温一体化的N个疑问[J].中国住宅设施,2023(4):38-40.
3王静,王宁.基于Bisecting K-Means聚类的公路交通流状态划分方法[J].数字技术与应用,2023,41(7):92-93.
4Qiushi Chen,Yuanliang Zhang,Keren Zhang,Jie Liu,Huozhen Pan,Xinran Wang,Siqi Li,Dandan Hu,Zhilong Lin,Yun Zhao,Guixue Hou,Feng Guan,Hong Li,Siqi Liu,Yan Ren.Profiling the Bisecting N-acetylglucosamine Modification in Amniotic Membrane via Mass Spectrometry[J].Genomics, Proteomics & Bioinformatics,2022,20(4):648-656.
5赵飞,娄文忠,冯恒振,苏子龙,汪金奎,宣炜琨.反无人机图像导引头远距空中目标探测技术[J].兵工学报,2023,44(4):1023-1033. 被引量：1
6毕志臻,杨德刚,冯骥.面向超大规模数据的自适应谱聚类算法[J].智能系统学报,2023,18(2):251-259.
7甄西媛,高超,李向华,冀杰.基于电动出租车数据的充电桩选址聚类方法比较[J].汽车工程学报,2023,13(4):564-573. 被引量：1
8Tianlong Zheng,Chunli Zhang,Yueting Shi,Debao Chen,Sheng Liu.Influencing Factors and Clustering Characteristics of COVID-19:A Global Analysis[J].Big Data Mining and Analytics,2022,5(4):318-338. 被引量：1
9孙雨辰,吕鉴非.有关住宅建筑的岩棉薄抹灰外墙外保温系统优化设计讨论[J].中文科技期刊数据库（全文版）工程技术,2023(6):115-119.
10Chuiju You,Guanjun Lin,Jinming Qiu,Ning Cao,Yundong Sun,Russell Higgs.Sensor Network Structure Recognition Based on P-law[J].Computer Systems Science & Engineering,2023,46(8):1277-1292.

计算机工程与应用

2023年第16期

浏览历史

内容加载中请稍等...

二分k-means锚点提取的快速谱聚类被引量：4

参考文献1

二级参考文献4

共引文献50

同被引文献33

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

二分k-means锚点提取的快速谱聚类 被引量：4

参考文献1

二级参考文献4

共引文献50

同被引文献33

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

二分k-means锚点提取的快速谱聚类被引量：4