一种中文伪评论语料半自动获取方法

Semi-automatic Acquisition of Fake Chinese Reviews

下载PDF

导出

摘要该文提出了一种中文伪评论语料半自动收集方法,主要包括数据收集、句法分析、情感倾向性分析等方法,并对影响方法正确性的错误进行了总结。文中着重介绍了一种句法分析方法,在句法分析的基础上提出了<评价对象,评价短语>的提取方法。该提取方法简化了情感二元对的句法呈现模式。同时,对部分实验结果进行了分析,对提高文本情感分析的准确率提出了一些建议。 An approach is introduced to acquire fake Chinese reviews semi-automatically.It mainly includes a platform to get fake reviews,a syntactic parser,and a sentiment analysis component.Emphasis is on a syntactic based sentiment pair extraction,<comment object,comment phrase>.Finally,we analyze some experimental results and give some suggestions to improve the accuracy of sentiment analysis.

作者郝秀兰许方曲蒋云良

机构地区湖州师范学院信息工程学院

出处《中文信息学报》 CSCD 北大核心 2016年第1期190-197,共8页 Journal of Chinese Information Processing

基金浙江省自然科学基金(LY12F02012) 国家级大学生创新创业训练计划(201310347007) 国家自然科学基金(61370173 61202290) 浙江省科技计划资助项目(2013C31138)

关键词计算机应用中文信息处理倾向性分析伪中文评论半自动获取 computer application Chinese information processing sentiment analysis fake Chinese reviews semiautomatic acquisition

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：539
2王素格,李德玉,魏英杰.基于赋权粗糙隶属度的文本情感分类方法[J].计算机研究与发展,2011,48(5):855-861. 被引量：19
3梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
4李国林,万常选,边海容,杨莉,钟敏娟.基于语素的金融证劵域文本情感探测[J].计算机研究与发展,2011,48(S3):54-59. 被引量：7
5王昊,杨亮,林鸿飞.日本地震的微博热点事件分析[J].中文信息学报,2012,26(5):7-13. 被引量：9
6林煜明,王晓玲,朱涛,周傲英.用户评论的质量检测与控制研究综述[J].软件学报,2014,25(3):506-527. 被引量：48
7张莉,钱玲飞,许鑫.基于核心句及句法关系的评价对象抽取[J].中文信息学报,2011,25(3):23-29. 被引量：22
8王根,赵军.基于多重冗余标记CRFs的句子情感分析研究[J].中文信息学报,2007,21(5):51-55. 被引量：32
9尹世超.动词直接作定语与名词中心语的类[J].语文研究,2002(2):1-7. 被引量：18
10吕叔湘译著..吕叔湘全集第1卷中国文法要略[M].沈阳:辽宁教育出版社,2002:481.

二级参考文献126

1陈昌来,陈烨.偏正结构VP+NP中NP与V的语义关系[J].安徽师大学报（哲学社会科学版）,1986,14(2):91-95. 被引量：4
2张国宪.“V_双+N_双”短语的理解因素[J].中国语文,1997(3):176-186. 被引量：69
3王立霞,孙宏林.现代汉语介词短语边界识别研究[J].中文信息学报,2005,19(3):80-86. 被引量：11
4彭伶楠.“好了”的词化、分化和虚化[J].语言科学,2005,4(3):74-80. 被引量：30
5刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
6朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
7赵军,许洪波,黄萱菁,谭松波,刘康,张奇.中文倾向性分析评测技术报告[C]//第一届中文倾向性分析评测会议(The First Chinese Opinion Analysis Evaluation).COAE,2008. 被引量：13
8张姝,贾文杰,夏迎炬,等.基于CRF的评价对象抽取技术研究[C]//Proceedings of the COAE2008,Harbin,2008:32-37. 被引量：5
9何婷婷,闻彬,宋乐,等.词语情感倾向性识别及观点抽取研究[C]//Proceedings of the COAE2008,Harbin,2008:8993. 被引量：4
10许洪波,姚天唠,黄萱菁,等.第二届中文倾向性分析评测技术报告[C]//第二届中文倾向性分析评测会议(COAE2009)论文集.北京:第二届中文倾向性分析评测委员会,2009:1-23. 被引量：4

共引文献772

1聂卉.基于内容特征的评论效用排名预测——以豆瓣书评为例[J].管理评论,2021(2):176-186. 被引量：12
2王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
3包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：5
4王弘睿,刘畅,于东.面向人工智能伦理计算的中文道德词典构建方法研究[J].中文信息学报,2021,35(10):39-47. 被引量：3
5王昭雨,庄惟敏.情感语义视角:街区更新后评估方法应用研究[J].建筑学报,2020(S02):105-109. 被引量：19
6刘栋,张彩环.情境特征及其在情感分类模型中的应用[J].计算机应用研究,2020,37(1):144-147.
7徐晖,王中卿,李寿山,张民.结合情感信息的个性化对话生成[J].计算机科学,2022,49(S02):99-104. 被引量：2
8张良波,任际范,周晶晶,吴欣宇.电商直播中弹幕互动特征对销售效率的影响[J].管理科学,2023,36(4):17-29.
9安颖,葛格.基于平行语料库的英汉电商评价对比研究[J].汉字文化,2022(23):113-115.
10蔡馥谣.抖音短视频中辽宁城市形象的呈现与传播策略研究[J].都市文化研究,2024(1):230-242.

1齐振宇,刘康,赵军.一种融合实体语义知识的实体集合扩展方法[J].中文信息学报,2013,27(2):1-9. 被引量：4
2马竹青.大数据时代数据图表呈现模式[J].黑龙江科学,2015,6(12):64-65. 被引量：1
3尹晓霈,张博,李丹.基于领域本体的垃圾邮件过滤器的研究[J].自动化仪表,2008,29(8):1-4.
4徐健,张辉,蔡劲松.一种现代汉语句法分析方法的建立与实现[J].计算机应用与软件,2004,21(1):39-41. 被引量：2
5张霞,胡珊珊.浅谈现代信息技术对教育的影响[J].科技信息,2009(29). 被引量：4
6赵学孔,龙世荣.基于Web的视频缩略图动态生成技术研究[J].电脑知识与技术,2015,0(4):201-203.
7牟苏斌,王颖.一体化数字地球引擎技术研究与实现[J].信息化研究,2014,40(4):12-15. 被引量：1
8周安宁,刘毅,李文正.一种计算机支持的飞机协同设计中的感知模型[J].计算机辅助设计与图形学学报,2011,23(10):1770-1779. 被引量：1
9王春荣,王斯日古楞,阿荣.基于层次短语的汉蒙统计机器翻译研究[J].内蒙古师范大学学报（自然科学汉文版）,2013,42(3):350-353. 被引量：2
10王力红.数据库汉语接口的一种低限制性句法分析方法[J].昆明理工大学学报（理工版）,1997,22(3):73-79.

中文信息学报

2016年第1期

浏览历史

内容加载中请稍等...

一种中文伪评论语料半自动获取方法

参考文献14

二级参考文献126

共引文献772

相关作者

相关机构

相关主题

浏览历史