-
题名大规模数据集谱聚类并行优化算法
- 1
-
-
作者
郝笑弘
尹青山
-
机构
山西水利职业技术学院
吉林大学软件学院
-
出处
《机械设计与制造》
北大核心
2021年第10期211-214,共4页
-
基金
亚太经济合作组织(APEC)项目(No.ZGYZJY2019YB)。
-
文摘
为解决传统谱聚类算法在应用于大规模数据上时,复杂度较高且资源占用较大,导致算法聚类效果不好甚至无法聚类的问题,提出基于并行框架和采样相结合的改进谱聚类算法,算法在自适应相似矩阵计算基础上,通过数据分块和单向节点并行,提高算法相似矩阵的计算效率,通过Nyström加权抽样逼近,减少拉普拉斯矩阵特征向量的计算复杂度,最后通过KD树结构避免k-mean聚类过程的距离计算,从而提高了聚类效率。仿真实验结果表明,文中算法在取得与传统算法相近的聚类性能的同时,取得更好的加速比,验证了算法对大规模集的良好适应性。
-
关键词
大规模谱聚类
自适应相似矩阵计算
单向节点并行
Nyström加权抽样
KD树优化
-
Keywords
Large-scale Clustering
adaptive similarity matrix calculation
One-way Node Parallel Computing
Nyström Weighted Sampling
KD-Tree Optimization
-
分类号
TH16
[机械工程—机械制造及自动化]
TP18
[自动化与计算机技术—控制理论与控制工程]
-