-
题名融合多窗口特征的词对标记情感三元组抽取
- 1
-
-
作者
林杰
刘建华
陈林颖
郑智雄
孙水华
-
机构
福建工程学院计算机科学与数学学院
福建省大数据挖掘与应用技术重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第16期159-167,共9页
-
基金
国家自然科学基金(62172095)
福建省自然科学基金(2023J01349)
福建工程学院发展基金(GY-Z20046)。
-
文摘
方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取模型。该模型利用BERT对句子信息进行处理,获取句子编码特征,采用多窗口特征学习机制学习局部范围内的情感特征关联,并挖掘句子包含的潜在语义信息,使用多头注意力图转换模块将所学习到的特征聚合成标记分布概率,利用改进的词对标记方案标记句子并解码得到三元组。在SemEval-ASTE的四个基准数据集上进行实验分析,相比GTS-BERT模型,所提模型在三元组抽取任务上F1分值分别提高了2.33、6.57、2.97、4.84个百分点。实验结果表明,所提模型可以有效学习局部语义信息,准确标记方面意见跨度,较为精确地提取情感三元组。
-
关键词
方面情感三元组
情感极性
特征学习
多头注意力
词对标记方案
-
Keywords
aspect sentiment triplet
sentiment polarity
feature learning
multi-head attention
word-pair tagging scheme
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合句法结构和语义信息的方面情感三元组抽取
- 2
-
-
作者
石恽本
苟刚
-
机构
贵州大学计算机科学与技术学院公共大数据国家重点实验室
-
出处
《计算机工程与设计》
北大核心
2024年第8期2468-2474,共7页
-
基金
国家自然科学基金项目(62162010)
贵州省科技支撑计划基金项目(黔科合支撑[2022]一般267)。
-
文摘
为解决先前方面情感三元组抽取方法中忽略句法结构和语义信息的问题,提出一种结合句法结构和语义信息的抽取模型。使用BERT预训练模型编码输入语句,同时编码句法结构特征。通过注意力层学习词对间的语义信息。将句法结构特征和语义信息输入图卷积网络,增强对单词间句法结构的学习。通过网格解码生成情感三元组。在lap14、res14、res15、res16数据集上的实验结果表明,该模型在精确率、召回率和F1值上相较其它基线模型有显著提升,有效提升方面情感三元组抽取效果。
-
关键词
方面情感三元组
句法结构
语义信息
BERT预训练模型
注意力
图卷积网络
网格
-
Keywords
aspect-based sentiment triplet
syntactic structure
semantic information
BERT pre-trained model
attention
graph convolutional network
grid
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合依存图卷积与文本片段搜索的方面情感三元组抽取
被引量:4
- 3
-
-
作者
徐康
李霏
姬东鸿
-
机构
武汉大学国家网络安全学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第4期61-67,共7页
-
基金
国家自然科学基金(62176187)
国家重点研发计划(2017YFC1200500)
+2 种基金
教育部哲学社会科学研究重大课题攻关项目(18JZD015)
教育部人文社科青年基金(22YJCZH064)
湖北省自然科学基金(2021CFB385)。
-
文摘
现有基于序列标注或文本生成的三元组抽取模型通常未考虑完整文本片段级别的交互,且忽略了句法知识的应用。为解决上述问题,提出一种基于依存图卷积与文本片段搜索的深度学习模型来联合抽取方面情感三元组。通过预训练语言模型BERT编码层学习句子中每个单词的上下文表达,同时利用图卷积神经网络学习句子单词之间的依存关系和句法标签信息,以捕获远距离的方面词与观点词之间的语义关联关系,并采用文本片段搜索构造候选方面词与观点词及其特征表示,最终使用多个分类器同时进行方面词与观点词抽取及情感极性判断。在ASTE-Data-V2数据集上的实验结果表明,该模型在14res、14lap、15res和16res子集上的F1值相比于JET模型提升了10.61、10.54、4.91和8.48个百分点,具有较高的方面情感三元组抽取效率。
-
关键词
方面情感三元组抽取
图卷积神经网络
深度学习
依存句法分析
文本片段搜索
-
Keywords
Aspect Sentiment Triple Extraction(ASTE)
graph convolution neural network
deep learning
dependency syntactic parsing
text span search
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名语义和句法依赖增强的跨度级方面情感三元组抽取
- 4
-
-
作者
李增伟
刘帅
-
机构
华南师范大学软件学院
-
出处
《计算机系统应用》
2024年第6期201-210,共10页
-
文摘
本研究针对目前跨度级别的方面情感三元组抽取模型忽视词性和句法知识的问题且存在三元组冲突的情况,提出了语义和句法依赖增强的跨度级方面情感三元组抽取模型SSES-SPAN (semantic and syntactic enhanced span-based aspect sentiment triplet extraction).首先,在特征编码器中引入词性知识和句法依赖知识,使模型能够更精准地区分文本中的方面词和观点词,并且更深入地理解它们之间的关系.具体而言,对于词性信息,采用了一种加权求和的方法,将词性上下文表示与句子上下文表示融合得到语义增强表示,以帮助模型准确提取方面词和观点词.对于句法依赖信息,采用注意力机制引导的图卷积网络捕捉句法依赖特征得到句法依赖增强表示,以处理方面词和观点词之间的复杂关系.此外,鉴于跨度级别的输入缺乏互斥性的保证,采用推理策略以消除冲突三元组.在基准数据集上进行的大量实验表明,我们提出的模型在效果和鲁棒性方面超过了最先进的方法.
-
关键词
方面情感三元组提取
方面提取
观点提取
词性信息
句法依赖关系
-
Keywords
aspect sentiment triplet extraction
aspect extraction
opinion extraction
part-of-speech information
syntactic dependency relation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名多特征交互的方面情感三元组提取
- 5
-
-
作者
陈林颖
刘建华
郑智雄
林杰
徐戈
孙水华
-
机构
福建理工大学计算机科学与数学学院
福建省大数据挖掘与应用技术重点实验室
闽江学院计算机与控制工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第4期1057-1067,共11页
-
基金
国家自然科学基金(62172095)
福建省自然科学基金(2023J01349)。
-
文摘
方面情感三元组提取是方面级情感分析的子任务之一,旨在提取句子中的方面词、其对应的意见词和情感极性。先前研究集中于设计一种新范式以端到端的方式完成三元组提取任务。然而,这些方法忽略外部知识在模型中的作用,没有充分挖掘和利用语义信息、词性信息以及局部上下文信息。针对上述问题,提出了多特征交互的方面情感三元组提取(MFI-ASTE)模型。首先,该模型通过BERT预训练模型学习句子中的上下文语义特征信息,并使用自注意力机制加强语义特征;其次,使语义特征与所提取到的词性特征交互,二者相互学习,加强词性的组合能力与语义信息;再次,使用多个不同窗口的卷积神经网络提取每个单词的多重局部上下文特征并使用多分门控机制筛选这些多重局部特征;然后,采用双线性层融合提取到的三类外部知识特征;最后,利用双仿射注意力机制预测网格标记并通过特定的解码方案解码三元组。实验结果表明,该模型在四个数据集上的F1值比现有的主流模型分别提升了6.83%、5.60%、0.54%和1.22%。
-
关键词
方面情感三元组提取
自注意力机制
卷积神经网络
网格标记方案
双仿射注意力机制
-
Keywords
aspect sentiment triplet extraction
self-attention mechanism
convolutional neural network
grid tagging
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合语法结构和语义信息的情感三元组提取
- 6
-
-
作者
杨芳捷
冯广
唐业凯
-
机构
广东工业大学计算机学院
广东工业大学自动化学院
-
出处
《计算机系统应用》
2024年第3期255-263,共9页
-
基金
国家自然科学基金重点项目(62237001)
广东省哲学社会科学青年项目(GD23YJY08)。
-
文摘
针对目前大多数方面情感三元组提取方法存在着没有充分考虑语法结构和语义相关性的问题.本文提出一种结合语法结构和语义信息的方面情感三元组提取模型,首先提出使用依赖解析器得到所有依赖弧的概率矩阵构建语法图,提取丰富的语法结构信息.其次利用自注意力机制构建语义图,表示单词与单词之间的语义相关性,从而减低噪声词的干扰.最后设计了一个相互仿射变换层,让模型可以更好地交换语法图和语义图之间的相关特征,提升模型情感三元组提取的表现.在多个公开数据集上进行验证.实验表明,与现有的情感三元组提取模型相比,精确度(P)、召回率(R)和F1值整体都有提高,验证了结合语法结构和语义信息在方面情感三元组提取的有效性.
-
关键词
方面情感三元组提取
语法结构
语义信息
图卷积网络
自注意力机制
-
Keywords
aspect sentiment triplet extraction
grammatical structure
semantic information
graph convolutional network(GCN)
self-attention mechanism
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—计算机科学与技术]
-
-
题名融合思维链和低秩自适应微调的方面情感三元组抽取
- 7
-
-
作者
曾碧卿
陈鹏飞
姚勇涛
-
机构
华南师范大学软件学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第7期53-62,共10页
-
基金
广东省普通高校人工智能重点领域专项(2019KZDZX1033)
广东省基础与应用基础研究基金(2021A1515011171)
广州市基础研究计划基础与应用基础研究项目(202102080282)。
-
文摘
方面情感三元组抽取(ASTE)任务是方面级情感分析的重要子任务之一,传统的监督学习方法在该任务上取得了SOTA或接近SOTA的效果。然而,随着深度神经网络的发展,生成式大型语言模型(LLM)为该任务带来了更多的可能性。目前大多数工作都是直接对LLM进行微调,但是忽略了LLM的幻觉现象,导致性能下降。提出一种融合思维链技术和LLM低秩自适应(Lo RA)微调LFC方法,实现生成式的ASTE新范式,以提升任务性能。在LFC中,首先基于思维链技术,通过人工构造少量推理样本,并利用LLM生成具有推理结构的增强数据集。将增强数据集用于微调Chat GLM3-6B模型的学习。在微调过程中,采用Lo RA微调技术提高在低资源环境下适配ASTE任务的效果。实验结果表明,LFC方法相比于最优的基线模型在Res14、Lap14、Res15和Res164个数据集上的F1值分别提升8.37、12.31、11.07和8.43个百分点,该方法不仅能够准确地识别三元组,而且在一定程度上优化了LLM的幻觉现象。
-
关键词
方面情感三元组抽取
大型语言模型
低秩自适应微调
思维链
提示学习
-
Keywords
Aspect Sentiment Triplet Extraction(ASTE)
Large Language Model(LLM)
Low-Rank Adaptation(LoRA)fine-tuning
Chain-Of-Thought(COT)
prompt learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名片段级别的双编码器方面情感三元组抽取模型
- 8
-
-
作者
张韵琪
李松达
兰于权
李东旭
赵慧
-
机构
华东师范大学软件工程学院
华东师范大学上海市高可信计算重点实验室
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第12期3010-3019,共10页
-
基金
国家重点研发计划(2019YFB2102600)。
-
文摘
方面情感三元组抽取(ASTE)是方面级情感分析的子任务之一,旨在识别出句子中所有的方面词及其对应的观点词和情感极性。目前,ASTE任务通过流水线模型或端到端模型完成,前者无法解决三元组方面词重叠问题,且忽视了观点词和情感极性之间的依赖关系;后者将ASTE任务分解为方面词和观点词抽取子任务以及情感极性分类子任务,通过共享编码器进行多任务学习,未区分两个子任务的特征差异,导致特征混淆问题。针对上述问题,提出了片段级别的双编码器方面情感三元组抽取模型(SD-ASTE)。该模型是流水线模型,分为两个模块。第一个模块基于片段抽取方面词和观点词,在片段特征表示中融入片段首尾和长度信息,关注方面词和观点词的边界信息;第二个模块判断方面词-观点词片段对表达的情感极性,采用基于悬浮标记的片段对特征表示方式,侧重于学习三元组各元素之间的依赖关系。模型利用两个独立编码器,分别为两模块提取不同的特征信息。多个数据集上的对比实验结果表明,该模型相较于目前最优的流水线模型和端到端模型具有更优的效果。通过有效性实验,验证了片段特征表示和片段对特征表示以及两个独立编码器的有效性。
-
关键词
情感分析
方面情感三元组抽取(ASTE)
流水线模型
片段
独立编码器
-
Keywords
sentiment analysis
aspect sentiment triplet extraction(ASTE)
pipeline model
span
independent encoders
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-