期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于特征词权重的文本分类
被引量:
1
1
作者
杨莉
万常选
+2 位作者
雷刚
俞涛
孔保新
《计算机与现代化》
2012年第10期8-13,共6页
在文本分类时,只有少数学者利用特征词权重对文本进行向量表示,但是所使用的特征选择算法没有考虑特征词权重的正负及其范围等。因此,本文在CHI统计基础上提出一种计算特征词类相关性的新方法,并根据各类特征集中包含的特征词的数量,选...
在文本分类时,只有少数学者利用特征词权重对文本进行向量表示,但是所使用的特征选择算法没有考虑特征词权重的正负及其范围等。因此,本文在CHI统计基础上提出一种计算特征词类相关性的新方法,并根据各类特征集中包含的特征词的数量,选用不同的文本类相关性计算方法;在判定文本类别过程中,只使用文本包含的特征词的个数及其类相关性,对含特征词少的文本也能很好判别。实验表明,该方法有效可行。
展开更多
关键词
文本分类
特征选择
特征词类相关性
文本类相关性
下载PDF
职称材料
题名
基于特征词权重的文本分类
被引量:
1
1
作者
杨莉
万常选
雷刚
俞涛
孔保新
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
出处
《计算机与现代化》
2012年第10期8-13,共6页
基金
国家自然科学基金资助项目(61173146)
国家社会科学基金资助项目(12CTQ042)
+1 种基金
江西省自然科学基金资助项目(2010GZS0067)
江西省教育厅科技重点项目(GJJ09650)
文摘
在文本分类时,只有少数学者利用特征词权重对文本进行向量表示,但是所使用的特征选择算法没有考虑特征词权重的正负及其范围等。因此,本文在CHI统计基础上提出一种计算特征词类相关性的新方法,并根据各类特征集中包含的特征词的数量,选用不同的文本类相关性计算方法;在判定文本类别过程中,只使用文本包含的特征词的个数及其类相关性,对含特征词少的文本也能很好判别。实验表明,该方法有效可行。
关键词
文本分类
特征选择
特征词类相关性
文本类相关性
Keywords
text
classification
feature
selection
correlation
-
score
between
feature
words
and
classification
correlation
-
score
between
text
and
classification
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于特征词权重的文本分类
杨莉
万常选
雷刚
俞涛
孔保新
《计算机与现代化》
2012
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部