-
题名基于边界剥离思想的全局中心聚类算法
- 1
-
-
作者
程明畅
敖兰
刘浏
-
机构
四川师范大学可视化计算与虚拟现实四川省重点实验室
四川师范大学数学科学学院
成都理工大学数学地质四川省重点实验室
成都理工大学数理学院
-
出处
《郑州大学学报(工学版)》
CAS
北大核心
2024年第5期86-94,共9页
-
基金
国家自然科学基金资助项目(12075162)
数学地质四川省重点实验室开放基金资助(scsxdz2023-4)
四川师范大学学科建设专项(XKZX2021-04)。
-
文摘
全局中心聚类算法如k-means、谱聚类在类簇分布出现重叠粘连现象时往往容易陷入局部最优且参数难以设定,极大地限制了全局中心聚类算法在实际应用中的效果。为解决此问题,提出了一种基于边界剥离思想的全局中心聚类算法。首先,设计了一步边界剥离法,根据样本点间的反向k近邻关系定义了一种局部距离加权密度,并利用密度经验分布函数一阶差分最大处的密度值作为阈值将数据集分为边界集与核心集。其次,嵌入传统的全局中心聚类算法对核心集进行聚类,得益于核心集的簇间重叠问题已明显改善,嵌入算法将更容易收敛到真实的簇中心。最后,提出一种边界吸引算法,从已被归类的核心集样本点出发,借助已有的反向k近邻关系迭代融合边界集中的样本点以完成对整个数据集的聚类。相较于目前以迭代方式进行的边界剥离算法,所提算法在计算效率上具有明显优势,不需要额外设定复杂的终止条件而直接通过阈值进行边界划分,并且全局性方法在数据局部密度存在差异的情形下具备更强的鲁棒性。在实验阶段,采用3个合成数据集以及6个真实数据集从算法性能、参数敏感性、时间消耗多个方面进行评估,实验结果进一步验证了此算法的有效性与实用性。
-
关键词
全局中心聚类算法
边界剥离
簇重叠
反向k近邻
经验分布
-
Keywords
globally central clustering algorithm
border peeling
overlapping
reverse k-nearest neighbors
empirical distribution
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP391
[自动化与计算机技术—计算机科学与技术]
-