-
题名异构并行计算下高维混合型数据聚类算法研究
被引量:2
- 1
-
-
作者
祝鹏
-
机构
内蒙古农业大学计算机技术与信息管理系
-
出处
《现代电子技术》
北大核心
2024年第9期139-142,共4页
-
基金
内蒙古哲学社会科学规划项目:基于大数据的内蒙古旅游目的地形象感知研究(2020NDC067)。
-
文摘
高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难”,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特征优化。采用K⁃Prototypes聚类算法提取高维混合型数据的统计序列特征,评估数据与类中心的相异性,计算数据与类中心的欧氏距离,实现高维混合型数据聚类。采用异构并行计算技术进行高维混合型数据K⁃Prototypes聚类的并行化处理,合理分配CPU与GPU工作,达到CPU与GPU的工作负载平衡,提高K⁃Prototypes的聚类效率。实验结果表明,此算法对于高维混合型数据的聚类效果好、运行时间短、性能稳定。
-
关键词
异构并行计算
高维混合型数据
k⁃prototypes聚类算法
欧氏距离
统计序列特征
负载平衡
-
Keywords
heterogeneous parallel computing
high⁃dimensional mixed data
k⁃prototypes clustering algorithm
Euclidean distance
statistical sequence feature
load balance
-
分类号
TN919-34
[电子电信—通信与信息系统]
TP312
[电子电信—信息与通信工程]
-