期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于类别强信息特征和贝叶斯算法的中文文本分类器 被引量:5
1
作者 陈艳秋 孙培立 《计算机应用与软件》 CSCD 北大核心 2014年第8期330-333,共4页
为了提高中文文本分类的效率与精度,设计一种新型的分类器。该分类器采用基于语料库的正向扫描统计分词。在词频统计阶段,采取训练阶段的按类别统计和测试阶段的按文章不同区域统计的方法;为了更好地选择特征词,提出了频度、集中度、相... 为了提高中文文本分类的效率与精度,设计一种新型的分类器。该分类器采用基于语料库的正向扫描统计分词。在词频统计阶段,采取训练阶段的按类别统计和测试阶段的按文章不同区域统计的方法;为了更好地选择特征词,提出了频度、集中度、相关度三个强信息特征标准;在特征权重计算上,提出了将词频和综合特征选择函数相结合的权重计算方法;最后,结合朴素贝叶斯原理进行分类。实验证明该分类器简单有效。 展开更多
关键词 中文文本分类 特征选择 特征权重 分类算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部