-
题名一种基于EPDS的快速K均值聚类算法
被引量:1
- 1
-
-
作者
陈作平
叶正麟
刘明
-
机构
西北工业大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2006年第12期191-192,195,共3页
-
基金
国家自然科学基金资助项目(10070006)
西北工业大学研究生创业种子基金资助项目(Z200570)
-
文摘
K-均值聚类是经常使用的一种数据聚类方法,但对大数据量情形,其聚类过程较慢,主要原因在于聚类过程中每个待聚类向量要反复进行一个最近邻搜索过程,以寻找与其距离最近的聚类中心;据此,文章提出使用扩展的部分失真搜索(Extended Partial Distortion Search,EPDS)来完成该最近邻搜索,极大地减少了完成聚类所需乘法次数。实验表明,相对于基本的K均值聚类算法,该方法可以节约1/3以上的计算量。
-
关键词
K均值聚类
扩展的部分失真搜索
最近邻搜索
-
Keywords
K-mean clustering
Extended partial distortion search (EPDS)
Nearest neighbor search
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于均衡化函数的快速K-means算法
被引量:1
- 2
-
-
作者
施培蓓
钱雪忠
汪中
-
机构
江南大学信息工程学院
中国科技大学计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第3期189-191,共3页
-
基金
教育部专项基金项目( 教技[2001] 750 号)
-
文摘
聚类分析的应用很广泛,传统的K-means算法要求事先给定k值,限制了很多实际的应用,由于聚类的质量主要考察类内的紧凑性和类间的距离,提出了均衡化的评价函数,使用最近邻搜索算法减少算法的计算量,不仅自动生成聚类的数目,同时均衡了类内差异和类间差异对于聚类结果的影响,实验结果证明改进的K-means算法的有效性。
-
关键词
K-均值算法
类内差异
类间差异
均衡化函数
扩展的部分失真搜索
-
Keywords
K-means algorithm
within cluster variation
between cluster variation
balanced function
EPDS
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-