一种适合于非线性高维数据的谱聚类算法被引量：2

A SPECTRAL CLUSTERING ALGORITHM FOR NONLINEAR HIGH DIMENSIONAL DATA

下载PDF

导出

摘要谱聚类能识别非线性数据,且优于传统聚类。谱聚类中度量相似性的高斯核函数尺度参数σ和聚类个数k对聚类效果影响较大,但需要人工判断。用向量之间夹角余弦代替σ并且通过特征值的跳跃性确定聚类个数,对于非线性高维数据,提出一种自适应谱聚类算法,将数据通过显式构造映射到随机特征空间,在随机特征空间中实现聚类。实验结果表明,在UCI数据上该算法与传统算法相比效果更好。 Spectral clustering can identify nonlinear data,and it is better than traditional clustering.The Gaussian kernel function scale parametersσand the number of clusters k that measure the similarity in spectral clustering have a great influence on the clustering effect,and face the problem of human determination.This paper used the angle cosine between the vectors to replace theσand determined the number of clusters k by jumping the eigenvalues.In order to solve the nonlinear high-dimensional data clustering,an adaptive spectral clustering algorithm was proposed to map the data to the stochastic feature space through explicit construction,and the clustering was realized in the stochastic feature space.The experimental results show that,compared with the traditional algorithm on UCI data,this algorithm has better effect.

作者王鸿菲杜洪波林凯迪姚云飞朱立军 Wang Hongfei;Du Hongbo;Lin Kaidi;Yao Yunfei;Zhu Lijun(School of Science,Shenyang University of Technology,Shenyang 110870,Liaoning,China;School of Computer Science and Technology,Tianjin University,Tianjin 300050,China;School of Information and Computing Science,Northern University for Nationalities,Yinchuan 750021,Ningxia,China)

机构地区沈阳工业大学理学院天津大学计算机科学与技术学院北方民族大学信息与计算科学学院

出处《计算机应用与软件》北大核心 2021年第9期268-272,292,共6页 Computer Applications and Software

基金国家自然科学基金项目(61362033)。

关键词谱聚类非线性高维自适应随机特征空间 Spectral clustering Non-linear high-dimensional Adaptive Random feature space

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1杜洪波,白阿珍,朱立军.基于改进的密度峰值算法的K-means算法[J].统计与决策,2018,0(18):20-24. 被引量：12
2何家玉..谱聚类算法的研究与应用[D].安徽理工大学,2017:
3王超..谱聚类算法在数据挖掘中的应用与研究[D].华东师范大学,2015:
4李金泽,徐喜荣,潘子琦,李晓杰.改进的自适应谱聚类NJW算法[J].计算机科学,2017,44(S1):424-427. 被引量：6
5张莉,周伟达,焦李成.核聚类算法[J].计算机学报,2002,25(6):587-590. 被引量：195
6张蓉,彭宏.一种基于超图模式的高维空间数据聚类方法[J].计算机工程,2002,28(7):54-55. 被引量：11
7姜洪权,王岗,高建民,高智勇,高瑞琪,郭旗.一种适用于高维非线性特征数据的聚类算法及应用[J].西安交通大学学报,2017,51(12):49-55. 被引量：12
8冯昌,廖士中.大规模核方法的随机假设空间方法[J].计算机科学与探索,2018,12(5):785-793. 被引量：6
9史卫亚..大规模数据集下核方法的技术研究[D].复旦大学,2008:
10王莉莉..谱聚类算法研究[D].河南大学,2012:

二级参考文献33

1贺玲,吴玲达,蔡益朝.高维空间中数据的相似性度量[J].数学的实践与认识,2006,36(9):189-194. 被引量：20
2胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20. 被引量：36
3[1]Jackson J E. A User's Guide To Principal Components.John Wiley & Sons,1991 被引量：1
4[2]Jain A K, Dubes R C. Algorithms for Cluster Data. Prentice Hall,1988 被引量：1
5[3]Agrawal R,Srikant R. Fast Algorithms for Mining Association rules.Proc.of the 20th VLDB Conference, 1994 被引量：1
6[4]Kirkpatrick S, Gelatt C D,Vecchi H M P. Optimization by Simulated Annealing. Science, 1983,220(4598):671-680 被引量：1
7[5]Hua K A,Lang S D,Lee W K. A Decomposition-based Simulated Ann -ealing Technique for Data Clustering. SIGMOD, 1994:117-128 被引量：1
8[6]Cheeseman P, Stutz J. Baysian Classification (Autoclass):Theory and Result. U.M.Fayyad,G.Piatetsky-Shapiro, P.Smith,and R.thurusamy,editors, Advances in Knowledge Discovery and Data Mining, 1996 被引量：1
9[7]Frakes W B,Stemming Algorithms.In W.B.Frakes and R.Baeza-Yate,Editors,Information Retrieval Data Structures and Algorithms, Prentice Hall, 1992 被引量：1
10杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117

共引文献235

1吕佳,熊浩.一种新城市气温模式分类的聚类算法[J].数学的实践与认识,2007,37(8):55-60.
2梁久祯.核函数参数优化的聚类算法[J].仪器仪表学报,2005,26(z1):678-680. 被引量：2
3宋启祥,张明玉,张锏.基于核聚类的MRI和PET医学图像分割方法[J].宿州学院学报,2005,20(1):88-90. 被引量：1
4沈红斌,王士同,吴小俊.离群模糊核聚类算法[J].软件学报,2004,15(7):1021-1029. 被引量：37
5伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
6陈才扣,高林,高秀梅,杨静宇.基于聚类的核矩阵维度缩减[J].数据采集与处理,2004,19(3):250-253.
7赵姝,张燕平,张媛,陈传明.基于交叉覆盖算法的改进算法——核平移覆盖算法[J].微机发展,2004,14(11):1-3. 被引量：6
8陈建斌,宋翰涛.基于属性分布相似度的超图高维聚类算法研究[J].计算机工程与应用,2004,40(34):195-198. 被引量：7
9郑岩,黄荣怀,战晓苏,周春光.基于遗传算法的动态模糊聚类[J].北京邮电大学学报,2005,28(1):75-78. 被引量：22
10潘晓英,王昊.一种基于核聚类的关键帧提取方法[J].微机发展,2005,15(3):29-31. 被引量：8

同被引文献15

1谢娟英,丁丽娟.完全自适应的谱聚类算法[J].电子学报,2019,47(5):1000-1008. 被引量：23
2李伯虎,柴旭东,侯宝存,林廷宇,张霖,李潭,刘阳,肖莹莹.云制造系统3.0——一种“智能+”时代的新智能制造系统[J].计算机集成制造系统,2019,25(12):2997-3012. 被引量：57
3辜振谱,刘晓波,韩子东,洪连环.基于改进密度峰值聚类的航空发动机故障诊断[J].计算机集成制造系统,2020,26(5):1211-1217. 被引量：8
4刘惠.基于混合型数据的自适应谱聚类集成算法[J].统计与决策,2020(9):35-39. 被引量：8
5郝予实,范玉顺.基于场景识别的云制造服务推荐[J].计算机集成制造系统,2020,26(8):2007-2019. 被引量：8
6冉冉,徐立波,曲睿婷,夏雨.基于LDA-FCM方法的Web服务发现聚类性能分析[J].计算技术与自动化,2020,39(3):166-171. 被引量：1
7郑婕.基于随机森林和XGBoost算法的二手车价格预测[J].数字技术与应用,2021,39(6):90-93. 被引量：6
8胡强,沈嘉吉,荆广辉,杜军威.基于描述语境特征词与改进GSDMM模型的服务聚类方法[J].通信学报,2021,42(8):176-187. 被引量：5
9李富强,彭海丽,杨熙,张文静.基于深度学习的二手车价格预测模型及影响分析[J].汽车工程学报,2021,11(5):379-385. 被引量：2
10李占山,姚鑫,刘兆赓,张家晨.基于LightGBM的特征选择算法[J].东北大学学报（自然科学版）,2021,42(12):1688-1695. 被引量：21

引证文献2

1黄雯,胡强,任志考.融合多维属性相似度的云制造服务谱聚类算法[J].计算机工程与设计,2023,44(10):2988-2996.
2张蝶依.基于LRSFFS和LightGBM的二手车价格预测研究[J].湖南邮电职业技术学院学报,2023,22(4):33-38.

1杨迪,蔡怡然,王鹏,李岩芳.基于改进谱聚类算法的交通区域划分方法[J].计算机工程与设计,2021,42(9):2478-2484. 被引量：5
2彭雨筝,李晓露,李聪利,丁一.基于残差卷积自编码的风光荷场景生成方法[J].电力建设,2021,42(8):10-17. 被引量：2
3钱梦薇,过弋.融合偏置深度学习的距离分解Top-N推荐算法[J].计算机科学,2021,48(9):103-109. 被引量：2
4王迪,董素芬,程芳,赵艳,李今.HSV空间下改进的直觉模糊C均值聚类猪肉图像检测[J].计量学报,2021,42(8):986-992. 被引量：2
5陈成瑞,孙宁,何世彪,廖勇.面向C-V2X通信的基于深度学习的联合信道估计与均衡算法[J].计算机应用,2021,41(9):2687-2693. 被引量：8

计算机应用与软件

2021年第9期

浏览历史

内容加载中请稍等...

一种适合于非线性高维数据的谱聚类算法被引量：2

参考文献10

二级参考文献33

共引文献235

同被引文献15

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种适合于非线性高维数据的谱聚类算法 被引量：2

参考文献10

二级参考文献33

共引文献235

同被引文献15

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种适合于非线性高维数据的谱聚类算法被引量：2