期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于特征词相交和流形学习的文本分类方法 被引量:1
1
作者 石陆魁 王歌 +1 位作者 杨璐 张军 《河北工业大学学报》 CAS 北大核心 2014年第2期1-7,共7页
针对文本分类中特征空间的高维性导致的"维数灾难"问题,提出了一种基于流形学习的文本分类模型,该模型利用流形学习算法对高维文本特征数据降维后再分类.同时针对夹角余弦中存在的相似性偏移问题,提出了一种新的文本相似性度... 针对文本分类中特征空间的高维性导致的"维数灾难"问题,提出了一种基于流形学习的文本分类模型,该模型利用流形学习算法对高维文本特征数据降维后再分类.同时针对夹角余弦中存在的相似性偏移问题,提出了一种新的文本相似性度量措施——特征词相交距离,其实质是计算两个文档中所包含的特征词的交集,并将该措施作为流形学习算法中选择邻域的依据.实验结果表明,特征词相交距离较好地表达了文档之间的相似性,利用基于特征词相交的流形学习算法对文本数据降维后再分类,在保证分类精度的前提下极大地提高了分类算法的执行效率,克服了采用欧式距离和夹角余弦选择邻域造成低维流形的扭曲从而导致的分类精度降低的问题. 展开更多
关键词 文本分类 特征词相交 流形学习 相似性偏移 夹角余弦
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部