期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
BGPNRE:一种基于BERT的全局指针网络实体关系联合抽取方法 被引量:3
1
作者 邓亮 齐攀虎 +2 位作者 刘振龙 李敬鑫 唐积强 《计算机科学》 CSCD 北大核心 2023年第3期42-48,共7页
实体-关系联合抽取指从非结构化文本中联合抽取出实体-关系三元组,是信息抽取和知识图谱构建的一项关键任务。文中提出了一种新的基于全局指针网络实体关系联合抽取方法BGPNRE(BERT-based Global Pointer Network for Named Entity-Rela... 实体-关系联合抽取指从非结构化文本中联合抽取出实体-关系三元组,是信息抽取和知识图谱构建的一项关键任务。文中提出了一种新的基于全局指针网络实体关系联合抽取方法BGPNRE(BERT-based Global Pointer Network for Named Entity-Relation Joint Extraction),首先通过潜在关系预测模块预测文本中蕴含的关系,过滤掉不可能存在的关系,将实体抽取限制在预测的关系子集中;其次通过使用基于关系的全局指针网络,获取所有主客体实体的位置;最后通过全局指针网络通信模块,将主客体位置高效率地解码对齐成一个实体关系三元组。该方法避免了传统管道式方法存在的错误传播问题,同时也解决了关系冗余、实体重叠、Span提取泛化不足等问题。实验结果表明,所提方法在多关系和重叠实体抽取上表现卓越,并且在NYT和WebNLG公共数据集上达到了最先进的水平。 展开更多
关键词 实体-关系联合抽取 BGPNRE 全局指针网络 BERT
下载PDF
基于自然语言处理的产业链知识图谱构建 被引量:13
2
作者 毛瑞彬 朱菁 +3 位作者 李爱文 周倚文 潘斌强 岳琳 《情报学报》 CSSCI CSCD 北大核心 2022年第3期287-299,共13页
产业链知识图谱在金融领域应用较为广泛,但目前多数研究是面向单一产业的知识图谱构建或面向产业竞争情报服务,并没有把产业链和知识图谱有机地结合起来。本文从产业链应用角度出发,对产业链知识图谱的构建方法进行研究。首先提出了产... 产业链知识图谱在金融领域应用较为广泛,但目前多数研究是面向单一产业的知识图谱构建或面向产业竞争情报服务,并没有把产业链和知识图谱有机地结合起来。本文从产业链应用角度出发,对产业链知识图谱的构建方法进行研究。首先提出了产业链知识图谱的构建流程和本体库,再基于领域语言模型,实现知识分类、抽取、融合等金融领域文本处理方法,对海量的领域文本进行知识抽取和融合,最终成功构建产业链知识图谱。根据本文方法构建的产业链知识图谱系统,覆盖产业链78个,细分行业7629个,已经应用到投融资、监管和产业规划等多个重要场景中。 展开更多
关键词 产业链 知识图谱 领域语言模型 实体关系联合抽取
下载PDF
融合交互注意力网络的实体和关系联合抽取模型
3
作者 郝小芳 张超群 +1 位作者 李晓翔 王大睿 《计算机工程与应用》 CSCD 北大核心 2024年第8期156-164,共9页
实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实... 实体关系三元组的抽取效果直接影响后期知识图谱构建的质量,而传统流水线式和联合式抽取的模型,并没有对句子级别和关系级别的语义特征进行有效建模,从而导致模型性能的缺失。为此,提出一种融合句子级别和关系级别的交互注意力网络的实体和关系联合抽取模型RSIAN,该模型通过交互注意力网络来学习句子级别和关系级别的高阶语义关联,增强句子和关系之间的交互,辅助模型进行抽取决策。在构建的中文旅游数据集(TDDS)的Precision、Recall和F1值分别为0.872、0.760和0.812,其性能均优于其他对比模型;为了进一步验证该模型在英文联合抽取上的性能,在公开英文数据集NYT和Webnlg上进行实验,该模型的F1值相比基线模型RSAN模型分别提高了0.014和0.013,并且该模型在重叠三元组的分析实验也均取得了优于基线模型的性能且更稳定。 展开更多
关键词 交互注意力网络 句子级别 关系级别 实体关系联合抽取 注意力机制 重叠三元组
下载PDF
融合数据增强和注意力机制的中医实体及关系联合抽取
4
作者 杨延云 杜建强 +2 位作者 聂斌 罗计根 贺佳 《智能计算机与应用》 2023年第8期186-191,196,共7页
中医药领域高质量标注数据缺乏,可用作实体及关系联合抽取任务的语料数量偏少。BiLSTM-CRF方法在序列标注上有优势,但对上下文信息与当前信息的关联关注不够,影响模型的性能。针对上述问题,提出一种融合数据增强和注意力机制的中医实体... 中医药领域高质量标注数据缺乏,可用作实体及关系联合抽取任务的语料数量偏少。BiLSTM-CRF方法在序列标注上有优势,但对上下文信息与当前信息的关联关注不够,影响模型的性能。针对上述问题,提出一种融合数据增强和注意力机制的中医实体及关系联合抽取方法(DA-BiLSTM-Attention-CRF)。该方法首先采用EDA数据增强方法对未标注训练集进行多倍增强,然后将增强后的伪标注数据加入训练集,采用自训练策略进行多次实验。最后,测试集数据通过模型预测得到标注序列并进行三元组提取。在中医语料库上进行实验评估,实体及关系联合抽取F1值为82.43%。 展开更多
关键词 中医文本 实体关系联合抽取 数据增强 注意力机制
下载PDF
基于深度学习的作物病虫害可视化知识图谱构建 被引量:36
5
作者 吴赛赛 周爱莲 +4 位作者 谢能付 梁晓贺 汪汇涓 李小雨 陈桂鹏 《农业工程学报》 EI CAS CSCD 北大核心 2020年第24期177-185,共9页
针对作物病虫害领域存在实体关系交叉关联、多源异构数据聚合能力差、知识共享困难等问题,利用知识图谱以结构化的形式描述实体间复杂关系的优势,该研究提出了一种基于深度学习的作物病虫害知识图谱构建方法。该方法在领域本体的基础上... 针对作物病虫害领域存在实体关系交叉关联、多源异构数据聚合能力差、知识共享困难等问题,利用知识图谱以结构化的形式描述实体间复杂关系的优势,该研究提出了一种基于深度学习的作物病虫害知识图谱构建方法。该方法在领域本体的基础上,以一种与领域语料相适应的新标注模式实现实体和关系的联合抽取。将实体和关系抽取任务转化为序列标注问题,对实体和关系进行同步标注,有效提高标注效率;为了解决重叠关系抽取问题,直接对三元组建模而不是分别对实体和关系建模,通过标签匹配和映射即可获得三元组数据。利用来自转换器的双向编码器表征量(Bidirectional Encoder Representations from Transformers,BERT)-双向长短期记忆网络(Bi-directional Long-Short Term Memory,BiLSTM)+条件随机场(Conditional Random Field,CRF)端到端模型进行试验,结果表明效果优于基于普通标注方式的流水线方法和联合学习方法中的卷积神经网络(ConvolutionalNeuralNetworks,CNN)+BiLSTM+CRF、BiLSTM+CRF等经典模型,F1得分为91.34%。最后,将抽取到的知识存储到Neo4j图数据库中,直观地反映知识图谱的内部结构,实现知识可视化和知识推理。该研究构建的知识图谱可为作物病虫害智能问答系统、推荐系统、智能搜索等下游应用提供高质量的知识库基础。 展开更多
关键词 作物 病虫害 模型 知识图谱 深度学习 实体关系联合抽取
下载PDF
面向领域知识图谱的实体关系联合抽取 被引量:15
6
作者 付瑞 李剑宇 +2 位作者 王笳辉 岳昆 胡矿 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期24-36,共13页
文本数据中的实体和关系抽取是领域知识图谱构建和更新的来源.针对金融科技领域中文本数据存在重叠关系、训练数据缺乏标注样本等问题,提出一种融合主动学习思想的实体关系联合抽取方法.首先,基于主动学习,以增量的方式筛选出富有信息... 文本数据中的实体和关系抽取是领域知识图谱构建和更新的来源.针对金融科技领域中文本数据存在重叠关系、训练数据缺乏标注样本等问题,提出一种融合主动学习思想的实体关系联合抽取方法.首先,基于主动学习,以增量的方式筛选出富有信息量的样本作为训练数据;其次,采用面向主实体的标注策略将实体关系联合抽取问题转化为序列标注问题;最后,基于改进的BERT-BiGRU-CRF模型实现领域实体与关系的联合抽取,为知识图谱构建提供支撑技术,有助于金融从业者根据领域知识进行分析、投资、交易等操作,从而降低投资风险.针对金融领域文本数据进行实验测试,实验结果表明,本文所提出的方法有效,验证了该方法后续可用于金融知识图谱的构建. 展开更多
关键词 领域文本 领域知识图谱 实体关系联合抽取 主动学习 序列标注
下载PDF
基于双向语义的中文实体关系联合抽取方法 被引量:8
7
作者 禹克强 黄芳 +1 位作者 吴琪 欧阳洋 《计算机工程》 CAS CSCD 北大核心 2023年第1期92-99,112,共9页
现有中文实体关系抽取方法通常利用实体间的单向关系语义特征进行关系抽取,然而仅靠单向语义特征并不能完全利用实体间的语义关系,从而使得实体关系抽取的有效性受到影响。提出一种基于双向语义的中文实体关系联合抽取方法。利用RoBERT... 现有中文实体关系抽取方法通常利用实体间的单向关系语义特征进行关系抽取,然而仅靠单向语义特征并不能完全利用实体间的语义关系,从而使得实体关系抽取的有效性受到影响。提出一种基于双向语义的中文实体关系联合抽取方法。利用RoBERTa预训练模型获取具有上下文信息的文本字向量表征,通过首尾指针标注识别句子中可能存在关系的实体。为了同时利用文本中的双向关系语义信息,将实体分别作为关系中的主体与客体来建立正负关系,并利用两组全连接神经网络构建正负关系映射器,从而对每一个输入实体同时从正关系与负关系的角度构建候选关系三元组。将候选关系三元组分别在正负关系下的概率分布序列与实体位置嵌入特征相结合,以对候选三元组进行判别,从而确定最终的关系三元组。在DuIE数据集上进行对比实验,结果表明,该方法的精确率与召回率优于MultiR、CoType等基线模型,其F1值达到0.805,相较基线模型平均提高了12.8%。 展开更多
关键词 实体关系联合抽取 双向关系语义 正负关系映射 全连接神经网络 预训练语言模型
下载PDF
基于分层序列标注的实体关系联合抽取方法 被引量:11
8
作者 田佳来 吕学强 +2 位作者 游新冬 肖刚 韩君妹 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期53-60,共8页
为了提高实体关系联合抽取的效果,提出一种端到端的联合抽取模型(HSL)。HSL模型采取一种新的标记方案,将实体和关系的联合抽取转化成序列标注问题,同时采用分层的序列标注方式来解决三元组重叠问题。实验证明,HSL模型能有效地解决三元... 为了提高实体关系联合抽取的效果,提出一种端到端的联合抽取模型(HSL)。HSL模型采取一种新的标记方案,将实体和关系的联合抽取转化成序列标注问题,同时采用分层的序列标注方式来解决三元组重叠问题。实验证明,HSL模型能有效地解决三元组重叠问题,在军事语料数据集上F1值达到80.84%,在公开的WebNLG数据集上F1值达到86.4%,均超过目前主流的三元组抽取模型,提升了三元组抽取的效果。 展开更多
关键词 实体关系联合抽取 三元组重叠 序列标注 知识图谱 HSL
下载PDF
融合BERT-WWM和指针网络的旅游知识图谱构建研究 被引量:8
9
作者 徐春 李胜楠 《计算机工程与应用》 CSCD 北大核心 2022年第12期280-288,共9页
针对旅游信息呈现出散乱、无序和关联性不强的问题,提出一种融合BERT-WWM(BERT with whole word masking)和指针网络的实体关系联合抽取模型构建旅游知识图谱。借助BERT-WWM预训练语言模型从爬取的旅游评论中获得含有先验语义知识的句... 针对旅游信息呈现出散乱、无序和关联性不强的问题,提出一种融合BERT-WWM(BERT with whole word masking)和指针网络的实体关系联合抽取模型构建旅游知识图谱。借助BERT-WWM预训练语言模型从爬取的旅游评论中获得含有先验语义知识的句子编码。针对传统的实体关系抽取方法存在错误传播、实体冗余、交互缺失等问题,以及旅游评论中的实体关系存在一词多义、关系重叠等特征,提出直接对三元组建模,利用句子编码抽取头实体,根据关系类别抽取尾实体,并建立级联结构和指针网络解码输出三元组。基于Neo4j图数据库存储三元组构建旅游知识图谱。实验在建立的旅游数据集上进行,融合BERT-WWM与指针网络的实体关系联合抽取模型的准确率、召回率和F1值分别为93.42%、86.59%和89.88%,与现有模型相比三项指标均显示出优越性,验证了该方法进行实体关系联合抽取的有效性。构建的旅游知识图谱实现了旅游景区信息的整合与存储,对进一步促进旅游业发展具有一定的实际参考意义。 展开更多
关键词 BERT-WWM 指针网络 旅游知识图谱 关系重叠 实体关系联合抽取
下载PDF
地质领域文本实体关系联合抽取方法 被引量:4
10
作者 邱芹军 王斌 +4 位作者 徐德馨 马凯 谢忠 潘声勇 陶留锋 《高校地质学报》 CAS CSCD 北大核心 2023年第3期419-428,共10页
地质领域实体关系抽取是构建地质知识图谱的基础,对地质领域文本信息抽取与知识库构建具有重要的作用。针对地质领域实体关系复杂、缺少人工标注语料库等特点,提出了面向地质领域实体关系联合抽取模型,着重对多地质文本中存在的复杂重... 地质领域实体关系抽取是构建地质知识图谱的基础,对地质领域文本信息抽取与知识库构建具有重要的作用。针对地质领域实体关系复杂、缺少人工标注语料库等特点,提出了面向地质领域实体关系联合抽取模型,着重对多地质文本中存在的复杂重叠关系进行识别,避免传统流水线模型中由于实体识别错误造成级联误差。文章构建了高质量地质领域实体关系语料库,提出了基于预训练语言模型BERT(Bidirectional Encoder Representations from Transformers)和双向门控循环单元BiGRU(Bidirectional Gated Recurrent Units)与条件随机场CRF(Conditional Random Field)的序列标注模型,实现对实体关系的联合抽取。在构建数据集上进行了实验,结果表明,本文提出的联合抽取模型在实体关系抽取上的F1值达到0.671,验证了本文模型在地质实体关系抽取的有效性。 展开更多
关键词 地质领域 实体关系联合抽取 知识图谱 BERT BiGRU
下载PDF
基于深度学习的实体关系联合抽取研究综述 被引量:3
11
作者 张仰森 刘帅康 +2 位作者 刘洋 任乐 辛永辉 《电子学报》 EI CAS CSCD 北大核心 2023年第4期1093-1116,共24页
实体关系抽取是信息抽取领域的核心任务.从文本中抽取的实体关系三元组是构建大规模知识图谱的基础.传统的流水线方法将实体关系抽取分解为独立的命名实体识别和关系抽取两个子任务.首先,构建一个高效的命名实体识别器,从大规模非结构... 实体关系抽取是信息抽取领域的核心任务.从文本中抽取的实体关系三元组是构建大规模知识图谱的基础.传统的流水线方法将实体关系抽取分解为独立的命名实体识别和关系抽取两个子任务.首先,构建一个高效的命名实体识别器,从大规模非结构化文本语句中识别实体边界和类型.然后,将该命名实体识别器识别的实体与类型作为关系抽取任务中所用数据的标注.最后,通过关系抽取器得到两个实体之间的关系类别,进而组合成为结构化的实体关系三元组.命名实体识别任务存在的误差会影响后续的关系抽取任务的性能,这使得流水线方法具有错误累积问题.这是因为关系抽取任务中使用的标注数据来自于前面的命名实体识别任务,这会有一定的误差,进而影响关系抽取的结果质量.此外,流水线方法减弱了两个子任务之间的特征关联,这会出现冗余实体的问题.命名实体识别任务和关系抽取任务独立进行学习训练,导致这两个子任务间缺乏交互,使得文本信息没有得到充分利用,限制了流水线方法的性能瓶颈.由于非结构化文本信息没有得到充分利用,流水线方法在抽取实体间长依赖关系时具有一定局限性,很难达到联合抽取模型的性能指标.实际应用中,实体间往往存在多种关系,流水线方法无法充分使用全局文本信息,且命名实体识别会产生冗余实体,在抽取多元重叠关系时,该方法具有一定的局限性.因此,在构建高准确率实体关系抽取模型时,流水线方法具有欠缺之处.本文对实体关系联合抽取的研究发展全景进行了综述,简要阐明整数线性规划、卡片金字塔解析模型、概率图模型和结构化预测模型这四类基于特征工程的联合模型的共同缺点.本文聚焦基于深度学习的实体关系联合抽取技术,根据近年来实体关系联合抽取前沿研究成果,总结了实体关系联合抽取模� 展开更多
关键词 信息抽取 知识图谱 深度学习 实体关系联合抽取 流水线方法
下载PDF
语义与句法信息加强的二元标记实体关系联合抽取 被引量:3
12
作者 衡红军 苗菁 《计算机工程》 CAS CSCD 北大核心 2023年第4期77-84,共8页
随着互联网技术不断地发展,数据信息呈爆炸性增长,迫切需要从海量数据中高效地提取关键信息,而实体关系抽取作为信息抽取的核心任务,发挥着不可替代的重要作用。现有基于深度学习的实体关系抽取方法存在误差累积、实体冗余、交互缺失、... 随着互联网技术不断地发展,数据信息呈爆炸性增长,迫切需要从海量数据中高效地提取关键信息,而实体关系抽取作为信息抽取的核心任务,发挥着不可替代的重要作用。现有基于深度学习的实体关系抽取方法存在误差累积、实体冗余、交互缺失、实体关系重叠等问题。为充分利用语句的语义信息和句法信息,提出一种加强语义信息与句法信息的二元标记实体关系联合抽取模型SSERel。通过对输入文本进行BERT编码,并对三元组主体的开始位置和结束位置进行预测标记,提取文本的全局语义特征、主体与每个词语的局部语义特征以及句法特征,并将其融合进编码向量。对语句每种关系的客体位置进行预测标记,最终完成三元组的提取。在NYT和WebNLG数据集上的实验结果表明,相比CasRel模型,该模型的F1值分别提升2.7和1.4个百分点,能够有效解决复杂数据中存在的重叠三元组和多三元组等问题。 展开更多
关键词 信息抽取 实体关系联合抽取 语义信息 句法依存分析 图卷积神经网络
下载PDF
融合注意力机制和指针标注的实体关系联合抽取方法 被引量:3
13
作者 唐楠楠 陈吉 +1 位作者 侯磊 王星 《小型微型计算机系统》 CSCD 北大核心 2023年第2期256-262,共7页
实体关系三元组是组成知识图谱的基本单位,其抽取的效果直接影响大型知识图谱的构建.针对目前多数关系抽取模型存在语义特征表达能力不足、实体关系发生重叠难以抽取等问题,本文提出了一种融合注意力机制和指针标注的实体关系联合抽取模... 实体关系三元组是组成知识图谱的基本单位,其抽取的效果直接影响大型知识图谱的构建.针对目前多数关系抽取模型存在语义特征表达能力不足、实体关系发生重叠难以抽取等问题,本文提出了一种融合注意力机制和指针标注的实体关系联合抽取模型.模型采用预训练语言模型BERT训练词向量,利用多头注意力机制获取丰富的语义特征信息,通过指针标注抽取主语,然后采用改进的层归一化将主语特征作为条件信息与句子向量进行特征融合来增强模型表达能力,最终在预定义的关系条件下抽取主语对应的宾语,通过分层的指针标注处理重叠问题.本文使用公开数据集NYT和WebNLG进行测试,实验结果表明该模型在两个数据集上的F1值相比基线模型分别提高了2.5%和0.9%,可有效提升三元组抽取效果,并在一定程度上解决了三元组重叠问题. 展开更多
关键词 知识图谱 实体关系联合抽取 BERT 注意力机制 指针标注
下载PDF
融合双阶段解码的实体关系联合抽取方法 被引量:3
14
作者 常思杰 林浩田 江静 《计算机工程与应用》 CSCD 北大核心 2023年第20期138-146,共9页
在现有的实体关系联合抽取任务中,级联解码的方法直接对三元组进行优化,解决了一部分重叠问题,但是在特定关系下解码的实体,造成实体识别不平衡问题。仅用集合预测的方法可以同时解码出实体和关系,虽然解决了三元组的顺序问题,但也导致... 在现有的实体关系联合抽取任务中,级联解码的方法直接对三元组进行优化,解决了一部分重叠问题,但是在特定关系下解码的实体,造成实体识别不平衡问题。仅用集合预测的方法可以同时解码出实体和关系,虽然解决了三元组的顺序问题,但也导致实体之间联系性不强、实体和关系之间交互性差的问题。为了进一步提高联合抽取模型的效果,提出一种融合双阶段解码的实体关系联合抽取模型,包括级联策略下的实体解码与集合预测网络阶段的关系解码。该模型分为三个部分:采用Bert进行编码,有效关注到了上下文的信息;采用级联解码的策略先对实体识别,得到不受关系限制的实体信息,充分识别实体;将融合了实体信息的表示嵌入集合预测网络解码出实体-关系三元组,加强实体与关系的联系。在公开数据集纽约时报(The New York Times,NYT)、WebNLG和ACE2005上的实验结果表明,所提出的模型基本优于基线模型,验证了该模型的有效性。 展开更多
关键词 实体关系联合抽取 重叠问题 级联解码 集合预测
下载PDF
基于图神经网络的关系抽取研究综述
15
作者 沈鑫怡 李华昱 +1 位作者 闫阳 张智康 《计算机系统应用》 2024年第3期1-11,共11页
在关系抽取任务中,通常利用构建依赖树或句法树来获得更深层和丰富的结构信息.图神经网络作为一种强大的图结构数据表示学习方法,可以更好地对这种复杂数据结构进行建模.本文介绍了基于图神经网络的关系抽取方法,旨在深入理解该领域的... 在关系抽取任务中,通常利用构建依赖树或句法树来获得更深层和丰富的结构信息.图神经网络作为一种强大的图结构数据表示学习方法,可以更好地对这种复杂数据结构进行建模.本文介绍了基于图神经网络的关系抽取方法,旨在深入理解该领域的最新研究进展和趋势.首先简要介绍了图神经网络的分类和结构,然后详细阐述了基于图神经网络的关系抽取方法的核心技术和应用场景,包括句子级和文档级方法,以及实体关系联合抽取方法.并分析和比较了各个方法的优缺点和性能表现,并探讨了未来可能的研究方向和挑战. 展开更多
关键词 关系抽取 图神经网络 图结构数据 实体关系联合抽取
下载PDF
基于潜在关系的实体关系联合抽取模型
16
作者 彭晏飞 张睿思 +1 位作者 王瑞华 郭家隆 《计算机科学与探索》 CSCD 北大核心 2024年第4期1047-1056,共10页
实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计... 实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计一种新的解码方式来减少预测过程中关系、实体和三元组的冗余信息,从整体上分为提取潜在实体对、解码关系两步来完成从句子中抽取三元组的任务。首先通过潜在实体对提取器预测实体间是否存在潜在关系,同时筛选出置信度高的实体对作为最终的潜在实体对;其次将关系解码视作多标签二分类任务,通过关系解码器预测每个潜在实体对之间全部关系的置信度;最后通过置信度确定关系数量和类型,以完成三元组的抽取任务。在两个通用数据集上的实验结果表明,所提模型相比基线模型在准确率和F1指标上的效果更好,验证了所提模型的有效性,消融实验也证明了模型内部各部分的有效性。 展开更多
关键词 实体关系联合抽取 潜在关系 潜在实体 多标签二分类任务 信息冗余
下载PDF
基于双集合预测网络的实体关系联合抽取模型 被引量:2
17
作者 彭晏飞 王瑞华 张睿思 《计算机科学与探索》 CSCD 北大核心 2023年第7期1690-1699,共10页
实体关系抽取任务旨在从非结构化文本中识别出实体和实体间的关系,是目前大规模知识图谱构建和更新的技术来源。在现有的实体关系联合抽取方法中,并行解码三元组的方法通过集合预测的方式高效生成三元组,然而这种方法忽略了实体与关系... 实体关系抽取任务旨在从非结构化文本中识别出实体和实体间的关系,是目前大规模知识图谱构建和更新的技术来源。在现有的实体关系联合抽取方法中,并行解码三元组的方法通过集合预测的方式高效生成三元组,然而这种方法忽略了实体与关系间、实体主客体间的交互,导致生成无效三元组。针对此问题,提出基于双集合预测网络的实体关系联合抽取模型。为了增强关系和实体之间的交互,采用双集合预测网络并行解码三元组,顺序生成三元组中实体信息和关系类型:第一个集合预测网络对三元组集合建模并解码出三元组内的主客体信息,第二个集合预测网络对融合了主客体信息的三元组嵌入集合建模并解码出主客体间的关系类型;针对实体主客体设计了一个实体过滤器,预测句子中实体间的主客体相关性并依照该结果过滤掉主客体相关性较低的三元组。在公开数据集纽约时报(NYT)和WebNLG上的实验结果表明,在编码器为BERT的情况下所提模型相较基线模型在准确率和F1指标上的效果更好,验证了该模型的有效性。 展开更多
关键词 实体关系联合抽取 双集合预测网络 实体过滤器 并行解码
下载PDF
基于异构图注意力网络的药物不良反应实体关系联合抽取研究
18
作者 仲雨乐 韩普 许鑫 《现代情报》 北大核心 2024年第9期71-81,共11页
[目的/意义]实体关系联合抽取是药物不良反应监测和知识组织的关键环节。为解决传统流水线抽取方法中误差传递、实体冗余和交互缺失问题,提升药物不良反应重叠三元组抽取效果,提出了一种基于异构图注意力网络的药物不良反应实体关系联... [目的/意义]实体关系联合抽取是药物不良反应监测和知识组织的关键环节。为解决传统流水线抽取方法中误差传递、实体冗余和交互缺失问题,提升药物不良反应重叠三元组抽取效果,提出了一种基于异构图注意力网络的药物不良反应实体关系联合抽取模型MF-HGAT。[方法/过程]首先通过BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;其次将关系信息作为先验知识引入为异构图节点,以避免提取语义无关实体;然后通过迭代融合异构图注意力网络消息传递机制增强字符与关系节点表示;最后在节点表示更新后抽取药物不良反应实体关系。[结果/结论]在自构建药物不良反应数据集上进行实验,发现融入关系信息和外部医疗健康领域知识的MF-HGAT联合抽取F1值达到了92.75%,较主流模型CasRel提升了5.29%。研究结果表明,MF-HGAT模型通过异构图注意力网络融合字符与关系节点语义,可有效解决药物不良反应实体关系重叠问题,对药物不良反应知识发现具有重要意义。 展开更多
关键词 异构图注意力网络 实体关系联合抽取 药物不良反应 关系重叠 知识发现
下载PDF
基于平行交互注意力网络的中文电子病历实体及关系联合抽取
19
作者 李丽双 王泽昊 +1 位作者 秦雪洋 袁光辉 《中文信息学报》 CSCD 北大核心 2024年第6期108-118,共11页
基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性... 基于电子病历构建医学知识图谱对医疗技术的发展具有重要意义,实体和关系抽取是构建知识图谱的关键技术。该文针对目前实体关系联合抽取中存在的特征交互不充分的问题,提出了一种平行交互注意力网络(PIAN)以充分挖掘实体与关系的相关性,在多个标准的医学和通用数据集上取得最优结果;当前中文医学实体及关系标注数据集较少,该文基于中文电子病历构建了实体和关系抽取数据集(CEMRIE),与医学专家共同制定了语料标注规范,并基于该文所提出的模型实验得出基准结果。 展开更多
关键词 实体关系联合抽取 双向特征交互模块 自注意力机制 中文电子病历 数据集标注与构建
下载PDF
融合强化学习的实体关系联合抽取模型
20
作者 翟社平 李航 +1 位作者 亢鑫年 杨锐 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期243-251,共9页
现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由... 现有的实体关系联合抽取任务为了自动生成大规模训练数据引入远程监督策略,在处理数据时产生严重的噪声数据问题。对此提出了一种融合强化学习的实体关系联合抽取模型,该模型由强化学习和联合抽取模型两个部分组成,其中联合抽取模型由图卷积网络和多头自注意力机制构成。首先,使用强化学习去除原始数据集中带有噪声的句子,将降噪后的高质量句子输入到联合抽取模型中;其次,使用联合抽取模型对输入句子中的实体和关系进行预测抽取,并向强化学习提供反馈奖励,指导强化学习挑选出高质量的句子;最后,对强化学习和联合抽取模型进行联合训练,并对模型进行迭代优化。实验证明了该模型能够有效处理数据噪声问题,在实体关系抽取方面优于基线方法。 展开更多
关键词 实体关系联合抽取 噪声数据 强化学习 多头自注意力机制 图卷积网络
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部