期刊文献+

基于距离和密度的多阶段聚类

Multi-stage Clustering Based on Distance and Density
下载PDF
导出
摘要 随着聚类技术的发展,对不同密度的数据集的聚类需求也越来越迫切。为了解决不同密度数据集的聚类问题,提出一种基于距离和密度的多阶段聚类算法MCDD。该算法主要采用多阶段密度处理技术提取不同密度的聚类,同时使用密度因子提高聚类的精度,最后通过使用距离阈值的方法去除孤立点和噪声数据。实验表明,该算法在扩展性方面表现良好,对任意形状和大小的聚类都可以很好地处理,并能够很好地识别出孤立点或噪声,在处理多密度聚类方面有很好的精度。 With the development of clustering technology, the demand of clustering of different density data sets is more and more urgent. In order to solve the clustering problem of different density data sets, proposes a multi-stage clustering algorithm based on distance and density (MCDD). The algorithm adopts multi-stage density processing technology to extract clustering of different density, while using the density factor to improve the precision of clustering, removes the outlier and noise data by using the distance threshold method. Scanning the dataset only once, the MCDD can discover clusters of arbitrary shapes. The experiment results show that it can discover outliers or noises effectively and get good cluster quality for multi-density data sets.
出处 《现代计算机(中旬刊)》 2014年第1期15-18,共4页 Modern Computer
基金 郑州市科技攻关项目(No.20130737)
关键词 密度阈值 阶段聚类 密度因子 距离阈值 孤立点 Density Threshold Multi-Stage Clustering Density Factor , Distance Threshold Outlier
  • 相关文献

参考文献4

二级参考文献19

  • 1邱保志,沈钧毅.网格聚类中的边界处理技术[J].模式识别与人工智能,2006,19(2):277-280. 被引量:13
  • 2邱保志,张西芝.基于网格的参数自动化聚类算法[J].郑州大学学报(工学版),2006,27(2):91-93. 被引量:14
  • 3邱保志,沈钧毅.基于扩展和网格的多密度聚类算法[J].控制与决策,2006,21(9):1011-1014. 被引量:25
  • 4Han J W, Kamber M. Data mining: Concepts and techniques[M]. 2nd ed. New York: Morgan Kaufmann, 2006: 384. 被引量:1
  • 5Xia C Y, Hsu W, Lee M L, et al. Border: Efficient computation of boundary point[J]. IEEE Trans on Knowledge and Data Engineering, 2006, 18(3): 289-303. 被引量:1
  • 6Ester M, Kriegel H P, Sander J. A density-based algorithm for discovering clusters in large spatial databases with noise[C]. Proc of the 2nd Int Conf on Knowledge Discovery and Data Mining. Portland: AAAI Press, 1996: 226-231. 被引量:1
  • 7Qiu B Z, Yue F, Shen J Y. BRIM: An efficient boundary points detecting algorithm[C], Proc of Advances in Knowledge Discovery and Data Mining. Heidelberg: SDrin~,er, 2007: 761-768. 被引量:1
  • 8Karypis G, Han E H, Kumar V. Chameleon: A hierarchical clustering algorithm using dynamic modeling[J]. IEEE Computer, 1999, 32(8): 68-75. 被引量:1
  • 9Hsu C M, Chen M S. Subspace clustering of high dimensional spatial data with noises[C]. Proc of Advances in Knowledge Discovery and Data Mining. Heidelberg: Springer, 2004: 31-40. 被引量:1
  • 10Han J W Kamber M 范明 孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版杜,2001.147-158. 被引量:113

共引文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部