摘要
针对划分聚类算法中聚类数K的取值工作量较大的问题,提出一种新的Canopy+算法.该算法可实现对聚类个数K的预判,在保证准确率的前提下提高聚类工作效率.
Aiming at the problem of large amount of work on the value of clustering number K in partition clustering algorithm, we proposed a new Canopy+ algorithm. The proposed algorithm can predict the clustering number K and improve the clustering efficiency on the premise of ensuring the accuracy.
作者
王海燕
崔文超
许佩迪
李闯
WANG Haiyan;CUI Wenchao;XU Peidi;LI Chuang(College of Computer Science and Technology,Changchun University,Changchun 130022,China;College of Computer,Jilin Normal University,Siping 136000,Jilin Province,China)
出处
《吉林大学学报(理学版)》
CAS
北大核心
2020年第3期634-638,共5页
Journal of Jilin University:Science Edition
基金
国家自然科学基金(批准号:21473069)
吉林省教育厅“十三五”科学规划项目(批准号:JKH20191000KJ)
吉林师范大学研究生科研创新计划项目(批准号:201947).
关键词
Canopy算法
划分聚类
聚类数
阈值
Canopy algorithm
partition clustering
clustering number
threshold