期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于相似中心的k-cmeans文本聚类算法 被引量:12
1
作者 许厚金 刘永炎 +1 位作者 邓成玉 刘永山 《计算机工程与设计》 CSCD 北大核心 2010年第8期1802-1805,共4页
针对k-means聚类算法只能保证收敛到局部最优,导致聚类结果对初始聚类中心敏感的问题,提出了一种基于相似中心的文本聚类算法。首先,度量文档之间的相似性,然后按照文档之间的相似性递减排序,选择序列最前面的k个文档作为初始聚类中心,... 针对k-means聚类算法只能保证收敛到局部最优,导致聚类结果对初始聚类中心敏感的问题,提出了一种基于相似中心的文本聚类算法。首先,度量文档之间的相似性,然后按照文档之间的相似性递减排序,选择序列最前面的k个文档作为初始聚类中心,对于每个剩余的文档(没有被选为初始簇中心的文档)根据其与存在的簇中心的相似性,将其分配到相似性最大的簇中,更新簇均值,连续迭代,直至均值不变,从而得到更加稳定的聚类结果。实验结果表明,提出的算法在宏平均聚类精度和宏平均召回率上有显著提高,产生了质量较好的聚类效果。 展开更多
关键词 k-cmeans算法 相似性度量 平均精度 平均召回率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部