期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于局部特征选择的微博中文文本分类研究
1
作者
单世超
栾翠菊
《现代计算机(中旬刊)》
2017年第8期11-16,共6页
微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证...
微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证;由于微博短文本维度高存在严重的特征稀疏问题,全局特征选择算法容易忽略对某个类别重要但对语料集关联度小的特征,并采用局部特征选择方案。实验结果证明局部特征选择方法可以获得更高的分类效果。
展开更多
关键词
微博
中文文本分类
全局
特征
选择
局部
特征
选择
WEKA
下载PDF
职称材料
题名
基于局部特征选择的微博中文文本分类研究
1
作者
单世超
栾翠菊
机构
上海海事大学信息工程学院
出处
《现代计算机(中旬刊)》
2017年第8期11-16,共6页
文摘
微博文本内容短小、用词不规范等缺点,使得微博文本的研究区别于通常的文本研究。目前微博研究很多,但缺少合适的带有标签的微博语料库。分析微博数据获取方案给出合适的带有分类标签的微博语料库,然后通过传统分类算法进行分类评估验证;由于微博短文本维度高存在严重的特征稀疏问题,全局特征选择算法容易忽略对某个类别重要但对语料集关联度小的特征,并采用局部特征选择方案。实验结果证明局部特征选择方法可以获得更高的分类效果。
关键词
微博
中文文本分类
全局
特征
选择
局部
特征
选择
WEKA
Keywords
Microblogging
Chinese Text Classification
Global Feature Selection
Partial Feature Selection
WEKA
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于局部特征选择的微博中文文本分类研究
单世超
栾翠菊
《现代计算机(中旬刊)》
2017
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部