-
题名二分K均值聚类算法优化及并行化研究
被引量:23
- 1
-
-
作者
张军伟
王念滨
黄少滨
蔄世明
-
机构
哈尔滨工程大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第17期23-25,共3页
-
基金
国家自然科学基金资助项目(60973028)
国家科技支撑计划基金资助项目(2009BAH42B02)
-
文摘
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。
-
关键词
数据挖掘
聚类算法
二分k均值
并行化
群集系统
-
Keywords
data mining
clustering algorithm
bisecting k-means(bkm)
parallelism
clustering system
-
分类号
TP338.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于二分K-均值的SVM决策树自适应分类方法
被引量:8
- 2
-
-
作者
裘国永
张娇
-
机构
陕西师范大学计算机科学学院
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第10期3685-3687,3709,共4页
-
基金
陕西省自然科学基金资助项目(2010JM8039)
-
文摘
分析和研究了自适应降维算法在高维数据挖掘中的应用。针对已有数据挖掘算法因维灾难导致的在处理高维数据时准确率和聚类质量都较低的情况,将二分K-均值聚类和SVM决策树算法结合在一起,提出了一种适用于高维数据聚类的自适应方法 BKM-SVMDT。该算法能保证二分K-均值聚类是在低维数据空间中进行,其结果再反过来帮助SVM在高维空间中的执行,这样反复执行以取得较好的分类精度和效率。标准数据集的实验结果证明了该方法的有效性。
-
关键词
二分k-均值
支持向量机决策树
降维
自适应算法
-
Keywords
bisecting k-means(bkm)
SVM decision tree(SVMDT)
dimension reduction
adaptive algorithm
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-