期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于指针级联标注的中文实体关系联合抽取模型 被引量:10
1
作者 王泽儒 柳先辉 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2022年第3期304-310,共7页
从非结构化文本中抽取实体关系是构建知识图谱流程中的重要一环,然而在解决中文文本的关系重叠与实体嵌套问题方面,已有的研究成果却很少,并且领域内基于联合学习的抽取方法大多无法识别实体类型。针对这些问题提出了一种基于指针级联... 从非结构化文本中抽取实体关系是构建知识图谱流程中的重要一环,然而在解决中文文本的关系重叠与实体嵌套问题方面,已有的研究成果却很少,并且领域内基于联合学习的抽取方法大多无法识别实体类型。针对这些问题提出了一种基于指针级联标注策略的中文实体关系联合抽取模型。模型采用以实体类型作为区分的指针标注策略来解决实体嵌套与预测实体类型的问题,并以关系模型作为函数,将句子中的头实体映射到尾实体以解决关系重叠问题。实验结果表明,该模型在两种不同领域的中文数据集上表现突出,F1值分别为81.1%,58.4%。利用此模型抽取的实体关系元组可以直接导入图数据库,极大地简化了从非结构化数据源构建知识图谱的流程。 展开更多
关键词 知识图谱 实体关系抽取 关系重叠 实体嵌套
原文传递
基于RoFormer预训练模型的指针网络农业病害命名实体识别
2
作者 王彤 王春山 +3 位作者 李久熙 朱华吉 缪祎晟 吴华瑞 《智慧农业(中英文)》 CSCD 2024年第2期85-94,共10页
[目的/意义]针对实体嵌套、实体类型混淆等问题导致的农业病害命名实体识别(Named Entities Recognition,NER)准确率不高的情况,以PointerNet为基准模型,提出一种基于RoFormer预训练模型的指针网络农业病害NER方法RoFormer-PointerNet。... [目的/意义]针对实体嵌套、实体类型混淆等问题导致的农业病害命名实体识别(Named Entities Recognition,NER)准确率不高的情况,以PointerNet为基准模型,提出一种基于RoFormer预训练模型的指针网络农业病害NER方法RoFormer-PointerNet。[方法]采用RoFormer预训练模型对输入的文本进行向量化,利用其独特的旋转位置嵌入方法来捕捉位置信息,丰富字词特征信息,从而解决一词多义导致的类型易混淆的问题。使用指针网络进行解码,利用指针网络的首尾指针标注方式抽取句子中的所有实体,首尾指针标注方式可以解决实体抽取中存在的嵌套问题。[结果和讨论]自建农业病害数据集,数据集中包含2867条标注语料,共10282个实体。为验证RoFormer预训练模型在实体抽取上的优越性,采用Word2Vec、BERT、RoBERTa等多种向量化模型进行对比试验,RoFormer-PointerNet与其他模型相比,模型精确率、召回率、F1值均为最优,分别为87.49%,85.76%和86.62%。为验证RoFormer-PointerNet在缓解实体嵌套的优势,与使用最为广泛的双向长短期记忆神经网络(Bidirectional Long Short-Term Memory,BiLSTM)和条件随机场(Conditional Random Field,CRF)模型进行对比试验,RoFormer-PointerNet比RoFormer-BiLSTM模型、RoFormer-CRF模型和RoFormer-BiLSTM-CRF模型分别高出4.8%、5.67%和3.87%,证明用指针网络模型可以很好解决实体嵌套问题。最后验证RoFormer-PointerNet方法在农业病害数据集中的识别性能,针对病害症状、病害名称、防治方法等8类实体进行了识别实验,本方法识别的精确率、召回率和F1值分别为87.49%、85.76%和86.62%,为同类最优。[结论]本研究提出的方法能有效识别中文农业病害文本中的实体,识别效果优于其他模型。在解决实体抽取过程中的实体嵌套和类型混淆等问题方面具有一定优势。 展开更多
关键词 农业病害 命名实体识别 实体嵌套 RoFormer预训练模型 指针网络
下载PDF
面向合同信息抽取的动态多任务学习方法
3
作者 王浩畅 郑冠彧 赵铁军 《软件学报》 EI CSCD 北大核心 2024年第7期3377-3391,共15页
对于合同文本中要素和条款两类信息的准确提取,可以有效提升合同的审查效率,为贸易各方提供便利化服务.然而当前的合同信息抽取方法一般训练单任务模型对要素和条款分别进行抽取,并没有深挖合同文本的特征,忽略了不同任务间的关联性.因... 对于合同文本中要素和条款两类信息的准确提取,可以有效提升合同的审查效率,为贸易各方提供便利化服务.然而当前的合同信息抽取方法一般训练单任务模型对要素和条款分别进行抽取,并没有深挖合同文本的特征,忽略了不同任务间的关联性.因此,采用深度神经网络结构对要素抽取和条款抽取两个任务间的相关性进行研究,并提出多任务学习方法.所提方法首先将上述两种任务进行融合,构建一种应用于合同信息抽取的基本多任务学习模型;然后对其进行优化,利用Attention机制进一步挖掘其相关性,形成基于Attention机制的动态多任务学习模型;最后针对篇章级合同文本中复杂的语义环境,在前两者的基础上提出一种融合词汇知识的动态多任务学习模型.实验结果表明,所提方法可以充分捕捉任务间的共享特征,不仅取得了比单任务模型更好的信息抽取结果,而且能够有效解决合同文本中要素与条款间实体嵌套的问题,实现合同要素与条款的信息联合抽取.此外,为了验证该方法的鲁棒性,在多个领域的公开数据集上进行实验,结果表明该方法的效果均优于基线方法. 展开更多
关键词 多任务学习 合同文本 信息联合抽取 注意力机制 实体嵌套
下载PDF
基于深度学习的中文实体关系抽取研究
4
作者 齐宁 《长江信息通信》 2024年第1期64-66,共3页
实体关系抽取能够从文本中提取事实三元组信息,这对于构建大规模的知识图谱是十分重要的。在现有的研究中,通常以先进行实体识别,而后进行关系分类或者进行统一标注的方式来完成这一任务,虽然这些方法能够使关系抽取任务变得更易实现,... 实体关系抽取能够从文本中提取事实三元组信息,这对于构建大规模的知识图谱是十分重要的。在现有的研究中,通常以先进行实体识别,而后进行关系分类或者进行统一标注的方式来完成这一任务,虽然这些方法能够使关系抽取任务变得更易实现,并且模型的网络框架灵活性更高,但是也存在误差积累和暴露误差等问题,且对于关系抽取中的关系重叠和实体嵌套等重难点问题不能够很好的处理。为了解决上述存在的问题,文章构建一种基于深度学习的中文实体关系联合抽取模型。该模型由基于评分的分类器和特定关系的角标记策略以及分区过滤网络构成,首先通过分区过滤网络,将输入的文本划分成三个分区,实体分区和关系分区以及共享分区,能够确保实体识别任务和关系抽取任务进行更好的双向交互;接着应用特定关系的角标记策略来解码实体信息,最后通过一个基于评分的分类器来输出事实关系三元组。实验表明,提出的方法能够改善传统方法带来的误差积累和交互缺失以及实体冗余等问题,提高了三元组抽取的准确率。 展开更多
关键词 关系抽取 知识图谱 实体嵌套
下载PDF
单步片段标注的实体关系联合抽取模型 被引量:1
5
作者 郑肇谦 韩东辰 赵辉 《计算机工程与应用》 CSCD 北大核心 2023年第9期130-139,共10页
关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注。关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了模型性能。因此,提出了一种基于片段标注的实体关系... 关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注。关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了模型性能。因此,提出了一种基于片段标注的实体关系联合抽取模型(span-labeling based model,SLM),主要包括:将实体关系抽取问题转化为片段标注问题;使用滑动窗口和三种映射策略将词元(token)序列进行组合排列重新平铺成片段(span)序列;使用LSTM和多头自注意力机制进行片段深层语义特征提取;设计了实体关系标签,使用多层标注方法进行关系标签分类。在英文数据集NYT、WebNLG上进行实验,相对于基线模型F1值显著提高,验证了模型的有效性,能有效解决上述问题。 展开更多
关键词 关系抽取 联合抽取 片段标注 映射策略 暴露偏差 实体嵌套 实体重叠
下载PDF
旅游领域嵌套实体和重叠关系联合抽取模型BPNRel 被引量:1
6
作者 陈赟 古丽拉·阿东别克 马雅静 《东北师大学报(自然科学版)》 CAS 北大核心 2023年第3期64-74,共11页
针对旅游领域信息抽取过程中出现的实体嵌套和关系重叠问题,提出一种基于多标签指针网络和双仿射分类器的实体关系联合抽取模型BPNRel.该模型通过共享编码层参数在实体抽取部分使用多标签指针网络确定嵌套实体和非嵌套实体的实体边界和... 针对旅游领域信息抽取过程中出现的实体嵌套和关系重叠问题,提出一种基于多标签指针网络和双仿射分类器的实体关系联合抽取模型BPNRel.该模型通过共享编码层参数在实体抽取部分使用多标签指针网络确定嵌套实体和非嵌套实体的实体边界和实体类型.在关系抽取部分融合了实体类型信息的编码层参数,经过双仿射分类器进行关系分类,在构建的旅游领域关系抽取数据集TFRED上的F1达到了90.4%,有效地解决了实体嵌套和关系重叠问题.此外,针对模型存在的标签不平衡问题使用Focal Loss损失函数调整正负样本损失值,并使用对抗训练提升模型的泛化能力,最后在百度DuIE数据集上与主流联合抽取模型进行了对比实验.实验证明,使用增强策略的BPNRel模型抽取优于主流的联合抽取模型. 展开更多
关键词 联合抽取 实体嵌套 关系重叠 标签平衡 对抗训练 旅游领域
下载PDF
融合字词特征的中文嵌套命名实体识别 被引量:1
7
作者 黄铭 刘捷 戴齐 《现代计算机》 2021年第34期21-28,共8页
命名实体识别(named entity recognition,NER)是信息抽取的重要组成部分,也是时下研究热点之一。由于中文没有明确的词边界,中文命名实体识别常使用基于字进行词嵌入的方法,但基于字的词嵌入方法会使文本表征学习变得困难。因此,本文提... 命名实体识别(named entity recognition,NER)是信息抽取的重要组成部分,也是时下研究热点之一。由于中文没有明确的词边界,中文命名实体识别常使用基于字进行词嵌入的方法,但基于字的词嵌入方法会使文本表征学习变得困难。因此,本文提出使用CNN(convolutional neural networks)结合Bi-LSTM(Bidirectional long short-term memory)作为表征学习方法。方法首先使用ANN(artificial neural network)对词向量进行学习,确保词向量的表征能力。然后,方法使用CNN对局部词特征进行学习,通过字词特征结合并使用Bi-LSTM学习文本上下文信息,有效提升文本表征学习能力。此外,针对命名实体识别中的实体嵌套问题,本文使用现有的合并标签标注方法并结合CRF进行序列标注。为验证本文方法有效性,本文选用几个基线模型与本文模型进行对比实验。实验结果表明,本文方法具有较优的识别性能。 展开更多
关键词 命名实体识别 实体嵌套 人工神经网络 双向LSTM 卷积神经网络
下载PDF
旅游领域实体和关系联合抽取方法研究 被引量:1
8
作者 陈赟 古丽拉·阿东别克 马雅静 《计算机工程与应用》 CSCD 北大核心 2022年第18期284-296,共13页
从文本信息中抽取关系三元组是构建知识图谱的关键任务,近年来受到工业界和学术界的广泛关注。针对旅游领域信息抽取过程中出现的实体嵌套和关系重叠问题,提出了一种基于双仿射注意力机制的实体关系联合抽取模型BAMRel,该模型通过共享... 从文本信息中抽取关系三元组是构建知识图谱的关键任务,近年来受到工业界和学术界的广泛关注。针对旅游领域信息抽取过程中出现的实体嵌套和关系重叠问题,提出了一种基于双仿射注意力机制的实体关系联合抽取模型BAMRel,该模型通过共享编码层参数利用双仿射注意力机制在实体识别部分和关系抽取部分构建分类矩阵,并在关系抽取部分融合实体类型信息,提升关系抽取效果的同时增加了两个任务之间的交互。此外,通过远程监督和人工校验构建了旅游领域关系抽取数据集TFRED,BAMRel模型在此数据集上F1值达到了91.8%,有效地解决了实体嵌套和关系重叠问题。为了验证模型的鲁棒性,在百度DuIE数据集上与主流联合抽取模型进行了对比实验,BAMRel模型取得了最高的F1值80.2%。 展开更多
关键词 联合抽取 实体嵌套 关系重叠 知识图谱 旅游领域
下载PDF
实体提及的多层嵌套识别方法研究 被引量:4
9
作者 刘非凡 赵军 徐波 《中文信息学报》 CSCD 北大核心 2007年第2期14-21,共8页
实体识别在许多自然语言处理应用系统中发挥着极其重要的作用。目前大部分研究集中在命名实体识别,且不考虑实体之间的嵌套,本文在自动内容抽取评测(Automatic Content Extraction,ACE)背景下,对汉语文本中各种实体提及(命名性,名词性,... 实体识别在许多自然语言处理应用系统中发挥着极其重要的作用。目前大部分研究集中在命名实体识别,且不考虑实体之间的嵌套,本文在自动内容抽取评测(Automatic Content Extraction,ACE)背景下,对汉语文本中各种实体提及(命名性,名词性,代词性)的多层嵌套识别进行了研究。我们将嵌套实体识别分成两个子任务:嵌套实体边界检测和实体多层信息标注。首先,本文提出了一种层次结构信息编码方法,将多层嵌套边界检测问题转化为传统的序列标注问题,利用条件随机场模型融合多种特征进行统计决策。其次,将多层信息标注问题看作分类问题,从实现的角度设计了含有两个分类引擎的并行SVM分类器,避免了对每层信息标注都设计一个分类器,比采用单一分类器在性能上有明显提高。在标准ACE语料上的实验表明,基于条件随机场的多层实体边界检测模型正确率达到71%,融合特征选择策略的两个并行分类引擎的正确率也分别达到了89.05%和82.17%。 展开更多
关键词 人工智能 自然语言处理 实体提及嵌套识别 条件随机场 支持向量机
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部