-
题名快速聚类算法在个性化服务中的应用
- 1
-
-
作者
张剑
李卫
钟义信
郭燕慧
-
机构
北京邮电大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第12期10-11,219,共3页
-
基金
国家863高技术研究发展计划项目资助(编号:2002AA117010-07)
-
文摘
许多实际应用已经证明,k-means算法能够有效地得到好的聚类结果。但是,k-means直接算法的时间复杂度和模式复杂度对数据量的大小非常敏感,无法满足一些高性能的应用场合,如个性化服务中对用户数据进行的群组分析。对此,笔者提出了一种新颖的基于k-d树的聚类算法。这种算法采用空间数据结构—k-d树组织所有的样本数据,可以高效地搜索到离某个给定的聚类中心最近的全部模式。实验结果表明,该方案可以显著提高k-means直接算法的运算速度,在距离运算量和总的运算时间上,可把性能提高1~2个数量级。
-
关键词
聚类k-平均
误差函数k-d树
个性化服务
-
Keywords
Cluster,k-means,Error function,k-d tree,Individuation information service
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-