期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种海量数据快速聚类算法
被引量:
7
1
作者
何倩
李双富
+1 位作者
黄焕
徐红
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2020年第3期118-124,共7页
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少Kmeans的欧氏距离计算次数.该算法基于S...
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少Kmeans的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.
展开更多
关键词
快速
聚
类
SPARK
最佳
聚
类
初始
点
网格划分
原文传递
题名
一种海量数据快速聚类算法
被引量:
7
1
作者
何倩
李双富
黄焕
徐红
机构
桂林电子科技大学卫星导航定位与位置服务国家地方联合工程研究中心
广西交科集团有限公司
出处
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2020年第3期118-124,共7页
基金
国家自然科学基金项目(61661015,61967005)
广西创新驱动重大专项项目(AA17202024)
广西科技创新团队项目(2019GXNSFGA245004)。
文摘
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少Kmeans的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.
关键词
快速
聚
类
SPARK
最佳
聚
类
初始
点
网格划分
Keywords
fast clustering
Spark
best initial clustering point
grid generation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种海量数据快速聚类算法
何倩
李双富
黄焕
徐红
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2020
7
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部