期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于增强序列标注策略的单阶段联合实体关系抽取方法 被引量:6
1
作者 朱秀宝 周刚 +2 位作者 陈静 卢记仓 向怡馨 《计算机科学》 CSCD 北大核心 2023年第8期184-192,共9页
从非结构化文本中抽取实体和关系是自动构建知识库的基础工作。现有的工作主要采用联合学习方法来解决嵌套实体、重叠关系、冗余计算和曝光偏差等问题,但单个模型仅在部分问题上表现出色,尚无模型可以同时解决上述问题。因此,提出了一... 从非结构化文本中抽取实体和关系是自动构建知识库的基础工作。现有的工作主要采用联合学习方法来解决嵌套实体、重叠关系、冗余计算和曝光偏差等问题,但单个模型仅在部分问题上表现出色,尚无模型可以同时解决上述问题。因此,提出了一种基于增强序列标注策略的单阶段联合实体关系抽取方法(A Token With Multi-labels Entity and Relation Extraction,ATMREL)。首先,设计了一种增强序列标注策略,将文本中的每个单词标记为多个标签,标签包含每个单词在实体中的位置、关系类型和实体位置信息。然后,将每个单词的标签预测转化为多标签分类任务,同时将联合实体关系抽取转化为序列标注任务。最后,为增强实体对之间的依赖关系,引入实体相关矩阵,用于对抽取结果进行剪枝,以提升模型抽取效果。实验结果表明,与CasRel和TPLinker模型相比,ATMREL模型在NYT和WebNLG数据集上的参数量减少了3.1×10^(6)~5.4×10^(6),平均推理速度提升了2~4.2倍,F1值提升了0.5%~2.1%。 展开更多
关键词 联合实体关系抽取 序列标注 组合标签 相关矩阵
下载PDF
基于图神经网络的联合实体关系抽取 被引量:6
2
作者 苗琳 张英俊 +1 位作者 谢斌红 李玉 《计算机应用研究》 CSCD 北大核心 2022年第2期424-431,共8页
从非结构化文本中联合提取实体和关系是信息抽取中的一项重要任务。现有方法取得了可观的性能,但仍受到一些固有的限制,如错误传播、预测存在冗余性、无法解决关系重叠问题等。为此,提出一种基于图神经网络的联合实体关系抽取模型BSGB(B... 从非结构化文本中联合提取实体和关系是信息抽取中的一项重要任务。现有方法取得了可观的性能,但仍受到一些固有的限制,如错误传播、预测存在冗余性、无法解决关系重叠问题等。为此,提出一种基于图神经网络的联合实体关系抽取模型BSGB(BiLSTM+SDA-GAT+BiGCN)。BSGB分为两个阶段:第一阶段将语义依存分析扩展到语义依存图,提出融合语义依存图的图注意力网络(SDA-GAT),通过堆叠BiLSTM和SDA-GAT提取句子序列和局部依赖特征,并进行实体跨度检测和初步的关系预测;第二阶段构建关系加权GCN,进一步建模实体和关系的交互,完成最终的实体关系三元组抽取。在NYT数据集上的实验结果表明,该模型F_(1)值达到了67.1%,对比在该数据集的基线模型提高了5.2%,对重叠关系的预测也有大幅改善。 展开更多
关键词 联合实体关系抽取 图注意力网络 语义依存图
下载PDF
基于主动学习的实体关系抽取的方法研究
3
作者 孙涵 《现代计算机》 2024年第8期77-83,共7页
关系分类是NLP中提取实体间关系的一项重要任务。介绍一种用于大规模的中文信息抽取数据集的方法,该方法将BERT合并到一个新的框架,并将主动学习应用于联合实体关系抽取中。这种模型从四个方面完善了现有的方法。第一,可以解决多个实体... 关系分类是NLP中提取实体间关系的一项重要任务。介绍一种用于大规模的中文信息抽取数据集的方法,该方法将BERT合并到一个新的框架,并将主动学习应用于联合实体关系抽取中。这种模型从四个方面完善了现有的方法。第一,可以解决多个实体属于多个三元组的问题。基于概率图的思想设计了该框架,并研究出一种新的“头尾”标记方法;第二,提出了一种将主动学习应用于关系抽取问题的创新方法;第三,为了在主、谓、宾三种实体之间传输信息,提出了一种新的规范化方法,称为条件层规范化;第四,设计了一个新的损失函数,以避免类不平衡。实验证明,增强了模型的信息提取能力,在单个模型的测试集上的F1⁃score达到0.840,在用完整数据训练的情况下与原始深度模型相比,用更少的数据取得了更好的性能。 展开更多
关键词 BERT 主动学习 联合实体关系抽取
下载PDF
基于BERT-WWM预训练的跨文档三元组提取 被引量:2
4
作者 章振增 《计算机应用与软件》 北大核心 2023年第6期181-186,215,共7页
关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通... 关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通过Span候选集模型生成初始实体信息,基于BERT-WWM预训练模型得到上下文以及候选实体相关Embedding信息进行分类任务从而实现SPO的联合提取。实验结果表明,该模型实体识别可达到F1值44.4%、关系分类准确率66.9%的较好效果。 展开更多
关键词 跨文档三元组抽取 BERT Span规则 联合实体关系抽取模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部