期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向海量数据的改进最近邻优先吸收聚类算法 被引量:5
1
作者 宁可 孙同晶 徐洁洁 《计算机工程》 CAS CSCD 北大核心 2018年第4期35-40,共6页
针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,... 针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,与K-means算法和最近邻优先吸收聚类算法相比,改进算法在保证聚类质量的基础上具有较快的运行速度,并适用于海量数据的聚类分析。 展开更多
关键词 海量数据 聚类 MAPREDUCE框架 最近邻优先吸收聚类算法 Canopy算法 并行化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部