-
题名融合方面语义和网格标记的多语言意见元组抽取
- 1
-
-
作者
古文霞
早克热·卡德尔
杨乾
艾山·吾买尔
-
机构
新疆大学信息科学与工程学院
新疆多语种信息技术重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2024年第4期324-333,共10页
-
基金
基于深度学习的新疆旅游情感分析技术研究项目(2021D01C081)。
-
文摘
面向方面的细粒度意见抽取(Aspect-oriented Fine-grained Opinion Extraction,AFOE)任务的目的是以意见对的形式抽取文本评论中的方面和意见词或者再抽取情感极性,形成意见三元组。以往的研究通常以管道方式抽取意见元素,容易出现错误传播的问题,而且大多数只关注方面词和意见词的单个子任务抽取,忽略了不同意见元素之间的相互影响和指示信息,导致意见挖掘任务不完整。此外,面向中文的意见元素抽取任务的研究较少。针对以上问题,文中提出了融合方面语义和网格标记的多语言意见元组抽取模型。首先,使用向内LSTM(Inward-LSTM)和向外LSTM(Outward-LSTM)编码方面词及其对应的上下文信息建立方面和候选意见词的关联,再结合全局信息生成特定方面语义特征的上下文表示,有利于提高下游意见元素抽取的性能。其次,使用网格标记方案的推理策略,利用方面和意见词之间的依赖指示信息进行更准确的抽取,以端到端的方式处理AFOE任务。相比基线模型,对于方面意见对抽取任务,改进的模型在中英文数据集上的F1值提高了0.89%~4.11%,对于三元组抽取任务提高了1.36%~3.11%,实验结果表明,改进的模型能有效地对中英文评论的意见元素进行抽取,性能显著优于基线模型。
-
关键词
方面意见对抽取
三元组抽取
网格标记方案
方面语义
面向方面的细粒度意见抽取
-
Keywords
Aspect-opinion pair extraction
Triplet extraction
Grid tagging scheme
Aspect semantics
Aspect-oriented fine-grained opinion extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-