摘要
主要讨论数据挖掘领域中一种基于密度的DBSCAN聚类算法,并对算法进行改进。利用取样技术缩小数据库的规模,减少算法的运行时间。利用遗传算法对聚类结果进行优化,保证聚类的质量。给出了一种基于取样的DBSCAN算法及其遗传优化。最后实验证明了算法的有效性。
The paper mainly discusses a clustering algorithm based on density in data mining,and improves DBSCAN algorithm. Sampling-based DBSCAN can reduce the size of the database, and save a lot of time. Genetic algorithm can optimize clustering result, and ensure clustering quality. It presents SDGO algorithm (a Sampling-based DBSCAN algorithm with Genetic Optimization). The end of the paper is the experimentation for the algorithm's efficiency
出处
《广西师范大学学报(自然科学版)》
CAS
北大核心
2007年第4期104-107,共4页
Journal of Guangxi Normal University:Natural Science Edition
基金
国家电网公司软课题研究项目(SGZL[2003]229)