摘要
针对近年来基于网格和密度的数据聚类算法均需要先验知识确定聚类相关参数的问题,提出了基于动态网格和密度邻接的数据聚类算法。该算法首先分析数据集的特征,确定网格单元的初始值,通过定义全局距离度量函数,对网格单元进行2-1动态递减迭代,最后得到全局最优聚类。实验结果证明:使用该算法对数据进行聚类,能够获得直觉上的最优聚类结果。将该算法应用到对GPS信息聚类中,也得到较为理想的效果。
This paper proposes a new algorithm of cluster data set in the condition of without prior data set knowledge. Based on the data set itself,the algorithm determines the init grid number and the result measure function first,then iterates the gird number in 2- 1 manner,clusters the data set,calculates the global distance,and finally gets the global result. Experiment proved that the algorithm can obtain the best cluster result. Also,the algorithm was used in a project of clustering GPS information and got the best result in intuition.
出处
《北京工业职业技术学院学报》
2015年第3期20-25,共6页
Journal of Beijing Polytechnic College
关键词
数据聚类
动态网格
密度邻接
算法
data cluster
dynamic grid
density neighbor
algorithm