基于Tri-training的评价单元识别被引量：4

Appraisal expression recognition based on Tri-training

下载PDF

导出

摘要评价单元的识别是情感倾向性分析中重要的一步,但由于标注语料匮乏,大多数研究集中在用人工构建规则、模板来识别评价单元的方法上。为了减轻标注训练语料的工作,同时进一步挖掘未标记样本的信息,提出一种基于协同训练机制的评价单元识别算法,以利用少量的已标记样本和大量的未标记样本来提高识别性能。该算法利用Tri-training的思想,将支持向量机(SVM)、最大熵(MaxEnt)以及条件随机场(CRF)三个不同分类器组合成一个分类体系,对生成的评价单元候选集进行分类。将Tri-training的算法思想应用于实验来对比采用单一分类器的方法,结果表明,该算法能够有效地识别主观句中的评价单元。 Appraisal expression recognition is very important in sentiment analysis.Because of the lack of labeled corpus,most former works in appraisal expression recognition are focused on construction of rules and templates manually.In order to reduce the training work of labeling corpus and further mining information of unlabeled corpus,a new algorithm based on co-training was proposed,which mainly used massive unlabeled corpus and only a small number of labeled corpus.The proposed algorithm was based on Tri-training and combined Support Vector Machine （SVM）,Maximum Entropy （MaxEnt） and Conditional Random Field （CRF） to build a new approach for candidate appraisal expression classification.By comparing the Tri-training based algorithm with the former single classifier based algorithms,the former can effectively improve the performance of appraisal expression recognition in subjective sentences.

作者蒋润顾春华阮彤

机构地区华东理工大学信息科学与工程学院

出处《计算机应用》 CSCD 北大核心 2014年第4期1099-1104,共6页 journal of Computer Applications

基金国家科技支撑计划项目(2013BAH11F03)

关键词半监督学习协同训练 TRI-TRAINING 评价单元依存分析评价对象 semi-supervised learning co-training Tri-training appraisal expression dependence analysis opinion target

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1马晓玲,金碧漪,范并思.中文文本情感倾向分析研究[J].情报资料工作,2013,34(1):52-56. 被引量：19
2ZHU X. Semi-supervised learning literature survey, Computer Sci- ence TR 1530 [ R]. Madison: University of Wisconsin, 2008. 被引量：1
3常瑜,梁吉业,高嘉伟,杨静.一种基于Seeds集和成对约束的半监督聚类算法[J].南京大学学报（自然科学版）,2012,48(4):405-411. 被引量：7
4LIU B, HU M, CHENG J. Opinion observer: analyzing and compa- ring opinions on the Web [ C ] // WWW '05: Proceedings of the 14th International Conference on World Wide Web. New York: ACM, 2005:342-351. 被引量：1
5姚天昉,娄德成.汉语语句主题语义倾向分析方法的研究[J].中文信息学报,2007,21(5):73-79. 被引量：78
6赵妍妍,秦兵,车万翔,刘挺.基于句法路径的情感评价单元识别[J].软件学报,2011,22(5):887-898. 被引量：58
7方明,刘培玉.基于最大熵模型的评价搭配识别[J].计算机应用研究,2011,28(10):3714-3716. 被引量：12
8徐冰,赵铁军,王山雨,郑德权.基于浅层句法特征的评价对象抽取研究[J].自动化学报,2011,37(10):1241-1247. 被引量：49
9SHAHSHAHANI B M, LANDGREBE D A. The effect of unlabeledsamples in reducing the small sample size problem and mitigating the Hughes phenomenon [ J]. IEEE Transactions on Geoscience and Re- mote Sensing, 1994, 32(5) : 1087 - 1095. 被引量：1
10周志华,王珏主编..机器学习及其应用 2007[M].北京:清华大学出版社,2007:275.

二级参考文献85

1李纲,程明结,寇广增.基于情感倾向识别的汽车评论挖掘系统构建[J].情报学报,2011,30(2):204-211. 被引量：14
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
3林传鼎,无.社会主义心理学中的情绪问题——在中国社会心理学研究会成立大会上的报告(摘要)[J].社会心理科学,2006,21(1):37-37. 被引量：15
4娄德成,姚天昉.汉语句子语义极性分析和观点抽取方法的研究[J].计算机应用,2006,26(11):2622-2625. 被引量：64
5徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：123
6POPESCU AM, ETZIONI O. Extracting product features and opinions from reviews [ C ]//Proc of Conference on Human Language Technolo- gy and Empirical Methods in Natural Language. Stroudsburg, PA: Association for Computational Linguistics,2005 : 339 - 346. 被引量：1
7LIU Bing, HU Min-qing, CHENG Jun-sheng. Opinion observer: ana- lyzing and comparing opinions on the Web[ C]//Proc of the 14th In- ternational Conference on World Wide Web. Now York: ACM Press, 2005 : 342-351. 被引量：1
8同义词词林(扩展版)[M].哈尔滨:哈尔滨工业大学信息检索研究中心. 被引量：1
9PIETRA S D, PIETRA V D, MERCER R L, et al. Adaptive lan- guage modeling using minimum discriminant estimation [ C ]//Proc of Speeeh and Natural Language DARPA Workshop. Stroudsburg, PA: Association for Computational Linguistics, 1992 : 103-106. 被引量：1
10DARROCH J N, RATELIFF D. Generalized iterative sealing for log- linear models [ J ]. Annals of Mathematical Statistie, 1972,43 (5) :1470-1480. 被引量：1

共引文献580

1武瑞娟,李佩毓,李研.线上消费者负面评论中贴图数量对评论有用性影响效应研究——一项基于负面评论的研究[J].管理评论,2022,34(12):157-172. 被引量：4
2张振刚,罗泰晔.基于在线评论数据挖掘和Kano模型的产品需求分析[J].管理评论,2022,34(11):109-117. 被引量：20
3刘昊.情感视域下社交媒体平台舆论分层与社群挖掘研究[J].中国网络传播研究,2018(2). 被引量：1
4夏松,林荣蓉,刘勘.网络谣言敏感词库的构建研究——以新浪微博谣言为例[J].知识管理论坛,2019(5):267-275. 被引量：6
5郭庆,贾郭军.基于tree LSTM的旅游评论情感分析方法研究[J].计算机应用研究,2020,37(S02):63-65. 被引量：6
6马建红,杨青云.针对专利背景技术的信息三元组抽取方法[J].计算机应用研究,2020,37(S01):247-249. 被引量：2
7裴曼如,张立文.基于投资者情绪和深度学习的股票价格趋势预测研究[J].金融发展,2020(1):78-97. 被引量：2
8吴杭鑫,张云华.基于词嵌入和自注意力机制的方面提取算法[J].智能计算机与应用,2021,11(4):25-29.
9丁学君,甘甜,田勇.基于文本分析法的高校主观教学评价研究[J].创新创业理论研究与实践,2024(9):10-16.
10卢辉鸿,马平,王肖.基于BERT-CLS-ATT模型的虚拟主播评论情感分类算法[J].中国人民公安大学学报（自然科学版）,2024,30(1):74-80.

同被引文献46

1聂卉,何欢.引入词向量的隐性特征识别研究[J].数据分析与知识发现,2020,4(1):99-110. 被引量：2
2陈刚,杨志强,刘秉权.一种基于PLS的概率神经网络分类算法[J].微电子学与计算机,2015,32(5):73-78. 被引量：4
3http://www.csie.ntu.edu.tw/-cjlin/libsvm/. 被引量：11
4NLPIR/ICTCLAS汉语分词系统[EB/OL].[2014-07-19].http://ictclas.nlpir.org/. 被引量：3
5Goldman S, Zhou Y. Enhancing supervised learning with unlabeled data [C]// 17th International Conference on Machine Learning, Stanford, USA, 2000: 327-334. 被引量：1
6Zhou Z H, Li M. Tri-Training: Exploiting unlabeled data using three classifiers[J ]. IEEE Transactions on Knowl- edge and Data Engineering, 2005, 17(11): 1529 -1541. 被引量：1
7Angluin D, Laird P. I.eaming from noisy examples[J]. Machine Learning, 1988, 2(4), 343 - 370. 被引量：1
8Zhu X, Ghahramani Z. Learning from labeled and unla- beled data with label propagation [ R]. Pittsburgh: Carnegie Mellon University, 2002. 被引量：1
9http: //www. cnnic, net. cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/ P020150723549500667087. pdf, 2015. 被引量：1
10HUANG S, NIU Z, SHI C. Automatic construction of domain- specific sentiment lexicon based on constrained label propaga- tion [J]. Knowledge-Based Systems. 2014, 56: 191-200. 被引量：1

引证文献4

1郭毅,黄磊.基于LPA和Tri-Training的半监督文本倾向性分类[J].北京交通大学学报,2015,39(6):114-121. 被引量：1
2杜思奇,李红莲,吕学强.基于汉语组块分析的情感标签抽取[J].情报理论与实践,2016,39(5):125-129. 被引量：4
3杨善良,孙启.基于注意力机制的循环神经网络评价对象抽取模型[J].计算机应用与软件,2019,36(3):202-209. 被引量：7
4孙家媛,张艳荣,谢云熙,王加迎,张丽霞.基于观点信息的电商文本评价单元识别[J].哈尔滨商业大学学报（自然科学版）,2022,38(2):177-185. 被引量：2

二级引证文献14

1王庚福.中文情感分析综述[J].电脑知识与技术,2016,0(6):133-134.
2赵冬晓,王效岳,白如江,刘自强.面向情报研究的文本语义挖掘方法述评[J].现代图书情报技术,2016(10):13-24. 被引量：7
3和敬涵,李长城,张沛,王小君,冯丽.基于改进标签传播算法的电力系统并行恢复分区方法[J].电网技术,2018,42(6):1776-1782. 被引量：21
4李良强,李开明,白梨霏,曹云忠,吴亮.网购农产品评论中的消费者情感标签抽取方法研究[J].电子科技大学学报（社科版）,2018,20(4):1-7. 被引量：1
5高明柯,赵卓,逄涛,王天保,邹一波,黄晨,李德旭.基于注意力机制和特征融合的手势识别方法[J].计算机应用与软件,2020,37(6):199-203. 被引量：7
6余本功,范招娣.面向自然语言处理的条件随机场模型研究综述[J].信息资源管理学报,2020,10(5):96-111. 被引量：18
7陈立,朱丙丽.基于多尺度与改进注意力机制的序列到序列模型[J].计算机应用与软件,2020,37(12):140-144.
8徐建国,刘泳慧,刘梦凡.基于BILSTM-CRF的高校政策语义角色标注研究[J].计算机工程与应用,2021,57(6):207-211. 被引量：4
9邱桂华,李贤阳,肖宝,阳建中.一种基于智能组卷的试题库随机分段抽题算法[J].北部湾大学学报,2020,35(11):31-35. 被引量：4
10张永成,王怀彬.基于Att-BiGRU-CRF模型的中文文本情感分析[J].天津理工大学学报,2021,37(6):31-35. 被引量：4

1柳永念,钟诚,焦小焦.基于单元识别的网页信息抽取方法[J].广西大学学报（自然科学版）,2011,36(5):787-791. 被引量：1
2常宝宝.基于统计的翻译等价词对抽取研究[J].计算机学报,2003,26(5):616-621. 被引量：11
3徐驰,徐燕凌.基于对象语义的图像分割和分类方法[J].重庆大学学报（自然科学版）,2006,29(8):98-101.
4施益强,朱晓铃,蔺方.基于多因子对象的高空间分辨率遥感影像道路提取[J].集美大学学报（自然科学版）,2010,15(4):312-316. 被引量：4
5刘丽娟,郑逢斌,郭珊珊,刘定一.基于神经网络的角色层次访问控制策略的研究[J].光盘技术,2008(8):33-34.
6单威俊,李锋,蒲海,冷文浩.船舶模型边界网格单元识别技术研究[J].计算机工程与设计,2008,29(10):2652-2654. 被引量：7
7张炯,雷小永,戴树岭.分布式虚拟环境下的混合应用层组播传输协议[J].计算机辅助设计与图形学学报,2011,23(2):357-362.
8臧国华,李久超,姚兆.虚拟维修训练的故障建模与仿真[J].中国科技博览,2009(6):134-134.
9马志伟,崔荣一,金小峰.基于半监督学习的行人检测方法研究[J].软件,2012,33(6):23-26. 被引量：1
10余祖波,马建军.一种利用统计语义单元识别中文人名的方法[J].小型微型计算机系统,2008,29(12):2339-2343. 被引量：1

计算机应用

2014年第4期

浏览历史

内容加载中请稍等...

基于Tri-training的评价单元识别被引量：4

参考文献16

二级参考文献85

共引文献580

同被引文献46

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于Tri-training的评价单元识别 被引量：4

参考文献16

二级参考文献85

共引文献580

同被引文献46

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于Tri-training的评价单元识别被引量：4