期刊文献+

一种基于CD-Tree的高效聚类算法

An Efficient Clustering Algorithm Based on CD-Tree
下载PDF
导出
摘要 基于网格的聚类算法可以高效处理低维的海量数据.然而,对于维数较高的数据集,生成的单元数过多导致算法的效率较低.CD-Tree是一种只保存非空单元的索引结构,基于CD-Tree设计了新的基于网格的聚类算法,利用CD-Tree的优点提高了传统的基于网格的聚类算法的效率.此外,该算法聚类时只需访问稠密单元,设计了优化策略,在聚类之前剪枝掉非稠密单元,进一步提高了算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法有更好的可伸缩性.
出处 《计算机研究与发展》 EI CSCD 北大核心 2006年第z3期371-375,共5页 Journal of Computer Research and Development
基金 国家自然科学基金项目(60473073,60573090) 辽宁省自然科学基金项目(20052006) 辽宁省教育厅攻关计划基金项目(05L354)
  • 相关文献

参考文献8

  • 1[1]R T Ng,J Han.Efficient and effective clustering methods for spatial data mining.The 20th VLDB Conference,Santiago,Chile,1994 被引量:1
  • 2[2]T Zhang,R Ramakrishnan,M Livny.BIRCH:An efficient data clustering method for very large databases.The 1996 ACM SIGMOD,Montreal,Canada,1996 被引量:1
  • 3[3]M Ester,H P Kriegel,J Sander,et al.A density-based algorithm for discovering clusters in large spatial databases.The KDD Conf,Portland OR,USA,1996 被引量:1
  • 4[4]M Ankerst,M M Breunig,H-P Kriegel,et al.Optics:ordering points to identify the clustering structure.The SIGMOD 1999,Philadelphia,Pennsylvania,USA,1999 被引量:1
  • 5[5]W Wang,J yang,R Muntz.STING:A statistical information grid approach to spatial data mining.The 23rd Conf on VLDB,Athens,Greece,1997 被引量:1
  • 6[6]G Sheikholeslami,S Chatterjee,A Zhang.Wavecluster:A multi-resolution clustering approach for very large spatial databases.The 24th Conf onVLDB,New York,NY,1998 被引量:1
  • 7[7]R Agrawal,J Gehrke,D Gunopulos,et al.Automatic subspace clustering of high dimensional data for data mining applications.The ACM SIGMOD Conf,Seattle,WA,1998 被引量:1
  • 8[8]Huanliang Sun,Yubin Bao,Faxin Zhao,et al.CD-trees:An efficient index structure for outlier detection.WAIM′04,Dalian,2004 被引量:1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部