期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于局部特征选择的微博中文文本分类研究
1
作者 单世超 栾翠菊 《现代计算机(中旬刊)》 2017年第8期11-16,共6页
微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证... 微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证;由于微博短文本维度高存在严重的特征稀疏问题,全局特征选择算法容易忽略对某个类别重要但对语料集关联度小的特征,并采用局部特征选择方案。实验结果证明局部特征选择方法可以获得更高的分类效果。 展开更多
关键词 微博 中文文本分类 全局特征选择 局部特征选择 WEKA
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部