期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
引入信息熵的CURE聚类算法 被引量:14
1
作者 伍恒 李文杰 蒋旻 《计算机应用研究》 CSCD 北大核心 2017年第8期2303-2305,共3页
为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数... 为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。 展开更多
关键词 层次聚类 CURE算法 信息熵 代表点选取
下载PDF
一种基于置信度的代表点选择算法 被引量:1
2
作者 黄云 洪佳明 覃遵跃 《计算机工程》 CAS CSCD 2012年第19期167-169,174,共4页
代表点选择是实现缩减数据集规模的有效途径,可以提高分类的准确率和执行效率。为此,通过引入分类置信度熵的概念,提出适应度评价函数,用于评估代表点的选择效果,以此找到最优的代表点集。该方法可与其他代表点选择方法结合,得到性能更... 代表点选择是实现缩减数据集规模的有效途径,可以提高分类的准确率和执行效率。为此,通过引入分类置信度熵的概念,提出适应度评价函数,用于评估代表点的选择效果,以此找到最优的代表点集。该方法可与其他代表点选择方法结合,得到性能更优的代表点选择方法。与多个经典代表点选择方法进行实验比较,结果表明基于置信度的代表点选择方法在分类准确率和数据降低率上有一定优势。 展开更多
关键词 置信度熵 适应度评价函数 代表点选择 k最近邻 半监督学习 遗传算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部