-
题名中文文本倾向性分类技术比较研究
被引量:14
- 1
-
-
作者
朱杰
刘功申
陈卓
-
机构
上海交通大学信息安全工程学院
海军装备上海局综合计划处
-
出处
《信息安全与通信保密》
2010年第4期56-58,共3页
-
基金
自然科学基金资助项目(批准号:60672068)
上海科委科技攻关资助项目(编号:08511501902)
-
文摘
随着近几年互联网的发展,网络评论数量正日益增加。对这些网络评论进行挖掘和分析,识别出其中的情感倾向,可以给用户、企业、政府提供重要的决策支持。采用机器学习方法中的朴素贝叶斯和支持向量机分类模型,根据不同的停用词表、特征选择方法、特征加权方法的组合,对中文文本倾向性分类进行了研究。结论表明,采用保留情感信息相关词性的停用词表,以文档频率为特征选择方法,并应用基于绝对词频的支持向量机分类模型,能取得较好的分类效果。
-
关键词
中文文本倾向性分类
停用词表
特征选择
特征加权
朴素贝叶斯
支持向量机
-
Keywords
semantic orientation classification of Chinese text
stop word list
feature selection
feature weighing assignment
na'f ve Bayesian classifier
support vector machine
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-