-
题名基于类中心与边界自寻优的聚类算法
- 1
-
-
作者
张文军
王建平
范世平
张柳霞
-
机构
中华女子学院计算机应用技术研究所
天地科技建井研究院
-
出处
《计算机系统应用》
2017年第11期118-123,共6页
-
基金
国家科技支撑计划资助项目(2012BAB13B00)
中华女子学院科研基金重点资助项目(KG2014-02002)
-
文摘
随着互联网应用的普及和深入,涌现了许多新的应用场景和数据类型,导致许多经典的聚类算法不能有效地适应新的发展形势,成为数据挖掘中的棘手问题和研究热点,为此提出一种新颖的基于类中心与边界自寻优的数据聚类算法.该算法引入数据点"距离半径"分布矩阵R及其"距离半径累计"分布矩阵ΣR概念表征数据聚合度,并依据广度优先原则自寻优R与ΣR中皆为最小的数据点作为类中心;同时,提出"距离半径偏导"分布矩阵R’,描述簇类之间的松散度,并采用广度优先原则自寻优矩阵R’中的突变跃迁增长点,作为簇类之间的分界.通过经典的Aggregation聚类数据集的仿真实验测试,表明该算法能够有效地对多种形状、大小和不同密度分布的数据集进行聚类分析,能较好地识别出孤立点和噪声,具有较高的鲁棒性和分析精度.
-
关键词
聚类
类中心自寻优
类边界自寻优
广度优先
数据挖掘
-
Keywords
clustering
self-optimizing class center
self-optimizing class border
breadth-first
data mining
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-