摘要
基于网格的聚类算法可以高效处理低维的海量数据.然而,对于维数较高的数据集,生成的单元数过多导致算法的效率较低.CD-Tree是一种只保存非空单元的索引结构,基于CD-Tree设计了新的基于网格的聚类算法,利用CD-Tree的优点提高了传统的基于网格的聚类算法的效率.此外,该算法聚类时只需访问稠密单元,设计了优化策略,在聚类之前剪枝掉非稠密单元,进一步提高了算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法有更好的可伸缩性.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第z3期371-375,共5页
Journal of Computer Research and Development
基金
国家自然科学基金项目(60473073,60573090)
辽宁省自然科学基金项目(20052006)
辽宁省教育厅攻关计划基金项目(05L354)