基于多任务迭代学习的论辩挖掘方法被引量：6

An Argumentation Mining Method Based on Multi-Task Iterative Learning

下载PDF

导出

摘要论辩挖掘可分为论点边界的检测、论点类型的识别、论点关系的抽取三个子任务.现有的工作大多数对子任务分别建模研究,忽略了三个子任务之间的关联信息,导致性能低下.另外,还有部分的工作采用流水线模型把三个子任务进行联合建模,由于流水线模型仍然是独立的看待每个子任务,为每个子任务训练单独的模型,存在错误传播的问题,且在训练过程中产生了冗余信息.因此,本文提出了一种基于多任务迭代学习的论辩挖掘方法.该方法将论辩挖掘三个任务并行地联合在一起学习,首先通过深度卷积神经网络(CNN)和高速神经网络(Highway Network),获得文本字符和词级别的浅层共享参数表示;然后输入双向长短时记忆循环神经网络(Bi-LSTM),利用论辩挖掘三个任务之间的关联信息进行同时训练,不仅可以避免错误传播,而且能够克服冗余信息的产生;最后,联结三个任务的Bi-LSTM网络输出作为下一次迭代的输入,来提高模型的性能.实验采用了德国UKP实验室公开的学生论文数据集,实验结果表明,与目前最好的基准方法对比,该方法的准确率指标提高了2.74%,“ F1 (100%)”和“ F1 (50%)”指标分别提高了1.05%和1.19%,很好地验证了该方法的有效性。 Argumentation mining has recently become a hot topic in the field of data mining and natural language processing. Its main task is automatic identification of argumentative structures in persuasive essays so as to help people better understand the massive text information. A persuasive essay usually consists of a series of argument components. The types of argument components are generally classified into claims or premises, and the types of relationship between argument components are commonly classified into support or attack. Argumentation mining typically contains three consecutive subtasks, i.e.,(1) Argument component boundary detection (ACBD Task), which involves separating argument component from non-argumentative text units and identifying the argument component boundaries;(2) Argument component identification (ACI Task), whose goal is to classify argument components into different types, such as claims or premises;(3) Argument component relation identification (RI Task), which aims to identify the relationship type between argument components, such as support or attack. Recently, many researchers have proposed a series of argumentation mining models and made brilliant improvement. However, most of the existing approaches mainly focus on modeling each subtask and ignore the correlation information among the three subtasks, resulting in low performance. In addition, some of the approaches utilize pipeline methods to jointly model three subtasks. The pipeline methods still consider each subtask independently, and train separated models for each subtask, which could lead to error propagation and redundant information in the training process. More specifically, the error of argument component boundary recognition module affects the following argument component classification performance. Similarly, the error of argument component classification also influences the performance of argument component relation identification. To solve these problems above, we propose a multi-task iterative learning method which a

作者廖祥文陈泽泽桂林程学旗陈国龙 LIAO Xiang-Wen;CHEN Ze - Ze;GUI Lin;CHENG Xue - Qi;CHEN Guo-Long(College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350116;Fujian Provincial Key Laboratory of Network Computing and Intelligent Information Processing (Fuzhou University), Fuzhou 350116;Digital Fujian Institute of Financial Big Data, Fuzhou 350116;CAS Key Laboratory of Network Data Science and Technology, Institute of Computing Technology,Chinese Academy of Sciences, Beijing 100190)

机构地区福州大学数学与计算机科学学院福建省网络计算与智能信息处理重点实验室(福州大学) 数字福建金融大数据研究所中国科学院网络数据科学与技术重点实验室

出处《计算机学报》 EI CSCD 北大核心 2019年第7期1524-1538,共15页 Chinese Journal of Computers

基金国家自然科学基金项目(61772135,U1605251) 中国科学院网络数据科学与技术重点实验室开放基金课题(CASNDST201708,CASNDST201606) 可信分布式计算与服务教育部重点实验室主任基金(2017KF01)资助~~

关键词多任务学习论辩挖掘迭代模型深度学习卷积神经网络 multi-task learning argumentation mining iterator model deep learning convolution neural network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献20

1朱倩,程显毅,韩飞.汉语句子语义三维表示模型[J].智能系统学报,2009,4(2):122-130. 被引量：4
2陈友,程学旗,杨森.面向网络论坛的高质量主题发现[J].软件学报,2011,22(8):1785-1804. 被引量：25
3叶宁玉,王鑫.从若干公共事件剖析网络群体极化现象[J].新闻记者,2012(1):46-51. 被引量：25
4王亚新.民事诉讼准备程序研究[J].中外法学,2000,12(2):129-161. 被引量：61
5曹丽娜,唐锡晋.基于主题模型的BBS话题演化趋势分析[J].管理科学学报,2014,17(11):109-121. 被引量：44
6奚雪峰,周国栋.面向自然语言处理的深度学习研究[J].自动化学报,2016,42(10):1445-1465. 被引量：224
7周阳,王雪菲,白朔天,赵楠,朱廷劭.基于网络平台的群体和个体的社会态度研究[J].中国科学院院刊,2017,32(2):188-195. 被引量：8
8陈建廷,向阳.深度神经网络训练中梯度不稳定现象研究综述[J].软件学报,2018,29(7):2071-2091. 被引量：48
9李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：106
10许赟杰,徐菲菲.基于ArcReLU函数的神经网络激活函数优化研究[J].数据采集与处理,2019,34(3):517-529. 被引量：18

引证文献6

1贾玉改,唐锡晋.在线极化辩论立场与理性表达关系研究[J].系统科学与数学,2019,39(10):1642-1654. 被引量：1
2廖祥文,倪继昌,魏晶晶,吴运兵,陈国龙.基于多任务联合学习的论辩挖掘[J].模式识别与人工智能,2019,32(12):1072-1079. 被引量：4
3徐菲菲,许赟杰.基于Arc-LSTM的人职匹配研究[J].山东大学学报（理学版）,2021,56(1):83-90.
4单华玮,路冬媛.基于双向注意力语境关联建模的论辩关系预测[J].软件学报,2022,33(5):1880-1892. 被引量：2
5张虎,季泽,王宇杰,李茹.裁判文书诉辩双方互动论点对识别方法研究[J].中文信息学报,2022,36(6):80-89.
6张可,艾中良,刘忠麟,顾平莉,刘学林.基于多元组匹配损失的司法论辩理解方法[J].计算机与现代化,2024(6):115-120.

二级引证文献7

1叶锴,魏晶晶,魏冬春,王强,廖祥文.面向低资源场景的论辩挖掘方法[J].福州大学学报（自然科学版）,2021,49(2):156-162. 被引量：1
2单华玮,路冬媛.基于双向注意力语境关联建模的论辩关系预测[J].软件学报,2022,33(5):1880-1892. 被引量：2
3陈云松.观念的“割席”——当代中国互联网空间的群内区隔[J].社会学研究,2022(4):117-135. 被引量：29
4赵金币,琚理.基于多任务学习的文本信息关联性抽取仿真[J].计算机仿真,2023,40(1):315-318.
5张国防,王鑫,徐建民.基于主题词共现的文档非对称关系量化研究[J].数据分析与知识发现,2023,7(3):110-120. 被引量：1
6言佳润,鲜于波.面向中文网络对话文本的论辩挖掘——基于微调与提示学习的大模型算法[J].中文信息学报,2023,37(10):139-148. 被引量：1
7张可,艾中良,刘忠麟,顾平莉,刘学林.基于多元组匹配损失的司法论辩理解方法[J].计算机与现代化,2024(6):115-120.

1马清华,韩笑.论语言的迭代机制及其在称代系统中的作用[J].苏州大学学报（哲学社会科学版）,2019,40(3):153-167. 被引量：5
2刘敬学,孟凡荣,周勇,刘兵.字符级卷积神经网络短文本分类算法[J].计算机工程与应用,2019,55(5):135-142. 被引量：22
3宋天琦,刘惠萍.基于用户端的智慧能源发展与应用实践[J].中国国情国力,2019,0(7):16-18. 被引量：1
4张玉坤,刘茂福,胡慧君.基于联合神经网络模型的中文医疗实体分类与关系抽取[J].计算机工程与科学,2019,41(6):1110-1118. 被引量：15
5疏官胜,刘炜清,李京.移动云中可模块并行应用的计算迁移算法研究[J].小型微型计算机系统,2019,40(2):241-247. 被引量：1
6栾金伟.基于大数据的数据挖掘技术在网络安全上的研究[J].电脑乐园,2018,3(9):251-251.
7孙五东,田振华,徐小丹,姜伟.公安信息多维感知管控平台的设计与应用[J].警察技术,2019(4):32-35. 被引量：3
8沈夏炯,侯柏成,韩道军,马瑞.基于流水线的增强型植被指数快速提取算法[J].计算机应用研究,2018,35(9):2827-2830. 被引量：1
9张哲,汪毓铎.结合边缘检测与CNN分类场景文本检测的研究[J].现代计算机,2019,25(13):67-70.
10徐里萍,侯玲,张建欣,赵丽.利用改进型语义特征的Web商品信息挖掘方法[J].信息技术,2019,43(7):142-145. 被引量：2

计算机学报

2019年第7期

浏览历史

内容加载中请稍等...

基于多任务迭代学习的论辩挖掘方法被引量：6

同被引文献20

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于多任务迭代学习的论辩挖掘方法 被引量：6

同被引文献20

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于多任务迭代学习的论辩挖掘方法被引量：6