摘要
该文提出了一种中文伪评论语料半自动收集方法,主要包括数据收集、句法分析、情感倾向性分析等方法,并对影响方法正确性的错误进行了总结。文中着重介绍了一种句法分析方法,在句法分析的基础上提出了<评价对象,评价短语>的提取方法。该提取方法简化了情感二元对的句法呈现模式。同时,对部分实验结果进行了分析,对提高文本情感分析的准确率提出了一些建议。
An approach is introduced to acquire fake Chinese reviews semi-automatically.It mainly includes a platform to get fake reviews,a syntactic parser,and a sentiment analysis component.Emphasis is on a syntactic based sentiment pair extraction,<comment object,comment phrase>.Finally,we analyze some experimental results and give some suggestions to improve the accuracy of sentiment analysis.
出处
《中文信息学报》
CSCD
北大核心
2016年第1期190-197,共8页
Journal of Chinese Information Processing
基金
浙江省自然科学基金(LY12F02012)
国家级大学生创新创业训练计划(201310347007)
国家自然科学基金(61370173
61202290)
浙江省科技计划资助项目(2013C31138)
关键词
计算机应用
中文信息处理
倾向性分析
伪中文评论
半自动获取
computer application
Chinese information processing
sentiment analysis
fake Chinese reviews
semiautomatic acquisition