期刊文献+

一种简单有效的基于密度的聚类分析算法 被引量:8

A Simple and Valid Density-Based Clustering Algorithm
下载PDF
导出
摘要 对数据挖掘中基于密度聚类的相关概念和算法进行了讨论,对OPTICS(O rdering Pointers to Iden-tify the C lustering Structure)算法聚类分析的正确性给以了证明。以DBSCAN,OPTICS为基础,提出了一种基于密度的简单有效的聚类算法。新算法主要在ε-邻域查询和种子队列的更新两个方面作了改进,给出了一种简单、效率较高的邻域查询方法-哈希表法,即对整个数据集合或部分数据作网格化处理。测试结果表明新算法能够有效地对大规模数据进行聚类,效率较高。 After discussing the concepts and algorithms of density-based clustering, the correctness of cluster analysis of OPTICS(Ordering Pointers to Identify the Clustering Structure) algorithm is proved. Moreover, a simple and valid density -based clustering algorithm is proposed, which is based on the original DBSCAN and OVFICS. The new algorithm makes improvements on region query and update of seeds queue. A simple and efficient region query method, hash - table method is developed. Experimental results show that the new algorithm is effective and efficient in clustering large -scale data sets.
出处 《南京邮电学院学报(自然科学版)》 2005年第4期24-29,共6页 Journal of Nanjing University of Posts and Telecommunications
关键词 数据挖掘 聚类 距离 密度 邻域查询 Data Mining Clustering Distance Density Region Queries
  • 相关文献

参考文献8

  • 1邵峰晶,于忠清编著..数据挖掘原理与算法[M].北京:中国水利水电出版社,2003:322.
  • 2NG R T,HAN J.Efficient and effective clustering methods for spatial datamining[A].In:Proc of the 20th VLDB Conf[C].Santiago: MorganKaufmann,1994.144~155. 被引量:1
  • 3ANKERST M, BREUNIG M.KRIEGEL H -P,et al.OPTICS: Ordering points to identify the clustering structure[A].In Proc 1999 ACM-SIGMOD Int Conf Management of Data[C]. Philadelphia, PA, June 1999.49~60. 被引量:1
  • 4HAN Jiawei,KAMBER M. Data Mining,Concepts and Techniques[M]. CA:Morgan Kaufmann Publishers, 2000. 被引量:1
  • 5JAIN A K,MURTY M N,FLYNN P J.Data Clustering:A Survey[J].ACM Comput Surv, 1999,31:264~323. 被引量:1
  • 6ESTER M,KRIEGEL H -P,SANDER J,et al.A Density-Based Algorithm for Discovering Clusterin Large Spatial Databases[A].In Proc 1996 Int Conf(KDD'96)[C].1996.226~231. 被引量:1
  • 7DATE C J. An Introduction to Database Systems,7th ed[M].MA:Addision-Wesley,2000. 被引量:1
  • 8周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量:42

二级参考文献6

  • 1Sheikholeslami G,Proceedings of the 2 4th VL DB Conference,1998年,428页 被引量:1
  • 2Zhang W,Proceedings of the 2 3rd VL DB Conference,1997年,186页 被引量:1
  • 3Chen M S,IEEE Transactions on Knowledge andData Engineering,1996年,8卷,6期,866页 被引量:1
  • 4Ester M,Proceedings of the 2nd International Conference on Knowledge Discovering in Data,1996年,226页 被引量:1
  • 5Zhang T,Proceedings of the ACM SIGMOD International Conference on Management of Data,1996年,103页 被引量:1
  • 6Ng R T,Proceedings of the2 0 th VL DB Conference,1994年,144页 被引量:1

共引文献41

同被引文献65

引证文献8

二级引证文献44

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部