摘要
针对某一类产品的文本倾向性分析成为了现在研究的热点.该文以搜索引擎的媒体报道为出发点,使用已有的情感词典集合,以及通过信息熵的方法从训练集合中提取特征词,采用贝叶斯分类方法对文本进行倾向性分析,将媒体新闻分为正面报道、负面报道和无倾向性3类,得到了比较理想的正确率.
Text orientation analysis for a given kind of production becomes research hotspot now. This paper researches in media news on search engines, using sentiment dictionaries and feature words from training set through information gain method to analyze the orientation with Bayes classifier. The texts are classified as positive news,negative news and neutral news. The precision is perfect.
出处
《江西师范大学学报(自然科学版)》
CAS
北大核心
2008年第2期127-131,共5页
Journal of Jiangxi Normal University(Natural Science Edition)
基金
国家重点基础研究(973)(2004CB318108)
国家自然科学基金(60621062,60503064,60736044)
“863”高科技(2006AA01Z141)资助项目
关键词
搜索引擎
倾向性分析
情感词典
信息熵
search engine
orientation analysis
sentiment dictionary
information gain