期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于半监督的大规模数据集聚类算法 被引量:1
1
作者 申彦 宋顺林 朱玉全 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期372-382,共11页
待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚... 待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚类结果质量不高,并且也不稳定.对此,吸收半监督聚类的思想,提出了基于标记集的半监督一遍扫描K均值算法,该算法利用驻留主存的标记集指导聚类过程,使得聚类效率以及聚类结果的质量得到了进一步的提高.在人工生成数据集以及1998KDD数据集上验证了该算法的有效性. 展开更多
关键词 大规模数据集聚类 半监督聚类 聚类数据压缩 数据挖掘 K均值聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部