期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
108
篇文章
<
1
2
…
6
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
实体关系抽取综述
被引量:
27
1
作者
王传栋
徐娇
张永
《计算机工程与应用》
CSCD
北大核心
2020年第12期25-36,共12页
实体关系抽取作为信息抽取任务的重要组成之一,能够对更小粒度的信息进行语义分析,为更多任务提供数据支持。关系抽取发展至今,总体可分为基于传统机器学习和基于深度学习两种方式。基于传统机器学习的关系抽取研究主要以统计和基于规...
实体关系抽取作为信息抽取任务的重要组成之一,能够对更小粒度的信息进行语义分析,为更多任务提供数据支持。关系抽取发展至今,总体可分为基于传统机器学习和基于深度学习两种方式。基于传统机器学习的关系抽取研究主要以统计和基于规则相结合的方法为主。基于深度学习的框架通过引入远程监督、小样本学习、注意力机制、强化学习、多示例多标记学习等方法取得了丰富的研究成果。回顾实体关系抽取的发展历程,对每种模型进行分析和讨论;结合深度学习方法的最新动态,对实体关系抽取未来的研究方向和趋势进行展望。
展开更多
关键词
实体关系抽取
机器学习
远程监督
图卷积网络
强化学习
神经网络
下载PDF
职称材料
基于深度学习的关系抽取研究综述
被引量:
24
2
作者
庄传志
靳小龙
+3 位作者
朱伟建
刘静伟
白龙
程学旗
《中文信息学报》
CSCD
北大核心
2019年第12期1-18,共18页
关系抽取(RE)是为了抽取文本中包含的关系,是信息抽取(IE)的重要组成部分。近年来,研究人员利用深度学习技术在该领域开展了深入研究。由于神经网络类型丰富,基于深度学习的关系抽取方法也更加多样。该文从关系抽取的基本概念出发,对关...
关系抽取(RE)是为了抽取文本中包含的关系,是信息抽取(IE)的重要组成部分。近年来,研究人员利用深度学习技术在该领域开展了深入研究。由于神经网络类型丰富,基于深度学习的关系抽取方法也更加多样。该文从关系抽取的基本概念出发,对关系抽取方法依据不同的视角进行了类别划分。随后,介绍了基于深度学习的关系抽取方法常用的数据集,并总结出基于深度学习的关系抽取框架。在此框架下,对关系抽取方法在面向深度学习的输入数据预处理、面向深度学习的神经网络模型设计等方面的具体工作进行了分析与评述,最后对未来的研究方向进行了探讨和展望。
展开更多
关键词
关系抽取
深度学习
远程监督
联合学习
下载PDF
职称材料
远程监督关系抽取综述
被引量:
20
3
作者
杨穗珠
刘艳霞
+2 位作者
张凯文
洪吟
黄翰
《计算机学报》
EI
CAS
CSCD
北大核心
2021年第8期1636-1660,共25页
远程监督可以为关系抽取任务自动构建数据集,缓解了人工构建数据集的压力和成本,为自动关系抽取的实现奠定基础,然而使用远程监督方法构建的数据集存在错误标注以及长尾问题,严重影响关系抽取性能。目前,远程监督关系抽取任务的主要研...
远程监督可以为关系抽取任务自动构建数据集,缓解了人工构建数据集的压力和成本,为自动关系抽取的实现奠定基础,然而使用远程监督方法构建的数据集存在错误标注以及长尾问题,严重影响关系抽取性能。目前,远程监督关系抽取任务的主要研究方向为关系模型的降噪手段以及对长尾关系的处理方法。近年来,随着深度学习技术的发展,这两个领域的研究工作也迎来了新一轮的机遇与挑战。本文对近几年远程监督关系抽取的研究进展进行综述,针对基于深度学习的远程监督关系抽取任务定义常用工作流,其中包括样本降噪、外部信息融合、编码器和分类器。本文根据不同的模块将已有的研究成果进行分类和梳理,分析比较主要方法,整理其中的关键问题,介绍已有的解决方案和相关数据集,总结远程监督关系抽取任务所用评测指标与评估方式,展望未来研究趋势。
展开更多
关键词
关系抽取
信息抽取
远程监督
降噪
长尾现象
错误标注
下载PDF
职称材料
基于改进注意力机制的实体关系抽取方法
被引量:
18
4
作者
冯建周
宋沙沙
+3 位作者
王元卓
刘亚坤
武红颖
龚昊
《电子学报》
EI
CAS
CSCD
北大核心
2019年第8期1692-1700,共9页
实体关系抽取是知识库构建中至关重要的一个环节.在众多的实体关系抽取方法中,远程监督结合神经网络模型的方法在准确率等性能上是比较令人满意的,但远程监督获取的标注语料中往往存在大量的噪声数据,给实体关系抽取模型的训练带来了很...
实体关系抽取是知识库构建中至关重要的一个环节.在众多的实体关系抽取方法中,远程监督结合神经网络模型的方法在准确率等性能上是比较令人满意的,但远程监督获取的标注语料中往往存在大量的噪声数据,给实体关系抽取模型的训练带来了很大的影响.本文提出一种基于改进注意力机制的卷积神经网络实体关系抽取模型.该模型针对包含同一实体对的句子集合,从中尽可能地找出所有体现该实体对关系的正实例,构建组合句子向量,抛弃可能的噪声句子,从而最大程度地降低噪声句子的影响又能充分利用正实例的语义信息.实验证明,本文提出的关系抽取模型在准确率上优于对比的关系抽取模型.
展开更多
关键词
关系抽取
改进注意力机制
卷积神经网络
远程监督
组合句子特征向量
下载PDF
职称材料
基于远程监督的关系抽取研究综述
被引量:
17
5
作者
白龙
靳小龙
+1 位作者
席鹏弼
程学旗
《中文信息学报》
CSCD
北大核心
2019年第10期10-17,共8页
关系抽取作为信息抽取的一项关键技术,在知识库自动构建、问答系统等领域有着极为重要的意义,一直以来受到人们的关注。远程监督关系抽取技术通过外部知识库作为监督源,自动对语料库进行标注,能够大量节省人工标注成本,因而受到了研究...
关系抽取作为信息抽取的一项关键技术,在知识库自动构建、问答系统等领域有着极为重要的意义,一直以来受到人们的关注。远程监督关系抽取技术通过外部知识库作为监督源,自动对语料库进行标注,能够大量节省人工标注成本,因而受到了研究者们的重视。该文针对远程监督关系抽取技术做了较为系统性的梳理,将已有方法分为基于概率图的、基于矩阵补全的和基于嵌入的三大类,并且对其当前面临的挑战进行了探讨,最后总结并展望了远程监督关系抽取技术未来的发展。
展开更多
关键词
远程监督
关系抽取
信息抽取
下载PDF
职称材料
基于GRU和注意力机制的远程监督关系抽取
被引量:
14
6
作者
黄兆玮
常亮
+2 位作者
宾辰忠
孙彦鹏
孙磊
《计算机应用研究》
CSCD
北大核心
2019年第10期2930-2933,共4页
随着深度学习的发展,越来越多的深度学习模型被运用到了关系提取的任务中,但是传统的深度学习模型无法解决长距离依赖问题;同时,远程监督将会不可避免地产生错误标签。针对以上两个问题,提出一种基于GRU(gated recurrent unit)和注意力...
随着深度学习的发展,越来越多的深度学习模型被运用到了关系提取的任务中,但是传统的深度学习模型无法解决长距离依赖问题;同时,远程监督将会不可避免地产生错误标签。针对以上两个问题,提出一种基于GRU(gated recurrent unit)和注意力机制的远程监督关系抽取方法。首先通过使用GRU神经网络来提取文本特征,解决长距离依赖问题;接着在实体对上构建句子级的注意力机制,减小噪声句子的权重;最后在真实的数据集上,通过计算准确率、召回率并绘出PR曲线证明该方法与现有的一些方法相比,取得了比较显著的进步。
展开更多
关键词
深度学习
远程监督
门控循环单元
注意力机制
下载PDF
职称材料
基于远程监督的人物属性抽取研究
被引量:
11
7
作者
马进
杨一帆
陈文亮
《中文信息学报》
CSCD
北大核心
2020年第6期64-72,共9页
属性抽取的主要目标是从非结构化文本中获取实体的属性值。为了从文本中抽取出人物属性,通常需要大量的标注数据,然而这些数据资源却十分稀少。为了解决这个问题,该文从百科类网页的表格数据出发,构建了人物属性表,然后采用远程监督的...
属性抽取的主要目标是从非结构化文本中获取实体的属性值。为了从文本中抽取出人物属性,通常需要大量的标注数据,然而这些数据资源却十分稀少。为了解决这个问题,该文从百科类网页的表格数据出发,构建了人物属性表,然后采用远程监督的方法得到大规模、多类别的人物属性标注语料,从而免去了人工标注的繁琐流程。针对新构建的数据集,分别使用条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)构建了属性抽取的两个基线模型。实验结果表明,BiLSTM-CRF取得比CRF更好的性能,其中BiLSTM-CRF的平均F1值为83.39%。
展开更多
关键词
属性抽取
标注数据
远程监督
下载PDF
职称材料
基于远程监督的多因子人物关系抽取模型
被引量:
10
8
作者
黄杨琛
贾焰
+3 位作者
甘亮
徐菁
黄九鸣
赫中翮
《通信学报》
EI
CSCD
北大核心
2018年第7期103-112,共10页
针对远程监督的基本假设过强容易引入噪声数据的问题,提出了一种可以对远程监督自动生成的训练数据去噪的人物实体关系抽取模型。在训练数据生成阶段,通过多示例学习的思想和基于TF-IDF的关系指示词发现的方法对远程监督产生的数据进行...
针对远程监督的基本假设过强容易引入噪声数据的问题,提出了一种可以对远程监督自动生成的训练数据去噪的人物实体关系抽取模型。在训练数据生成阶段,通过多示例学习的思想和基于TF-IDF的关系指示词发现的方法对远程监督产生的数据进行去噪处理,使训练数据达到人工标注质量。在模型分类器中,提出采用词法特征和句法特征相结合的多因子特征作为关系特征向量用于分类器的学习。在大规模真实数据集上的实验结果表明,所提模型结果优于同类型的关系抽取方法。
展开更多
关键词
关系抽取
人物关系
远程监督
机器学习
自然语言处理
下载PDF
职称材料
融合多特征的基于远程监督的中文领域实体关系抽取
被引量:
10
9
作者
王斌
郭剑毅
+2 位作者
线岩团
王红斌
余正涛
《模式识别与人工智能》
EI
CSCD
北大核心
2019年第2期133-143,共11页
针对从未标记的文本中抽取中文领域实体关系的问题,文中提出基于远程监督的领域实体属性关系抽取的混合方法,利用知识库中已有结构化的关系三元组,从自然语言文本中自动获取训练语料.针对远程监督方法标注数据存在大量噪声的问题,采用...
针对从未标记的文本中抽取中文领域实体关系的问题,文中提出基于远程监督的领域实体属性关系抽取的混合方法,利用知识库中已有结构化的关系三元组,从自然语言文本中自动获取训练语料.针对远程监督方法标注数据存在大量噪声的问题,采用隐含狄利克雷分布主题模型抽取主题关键词,再与关系类型进行相似度计算和对关键词模式匹配进行去噪.最后提取词性特征、依存关系特征和短语句法树特征,并进行融合,训练关系抽取模型.实验表明,3种特征融合的F值较高,抽取性能较好.
展开更多
关键词
远程监督
实体关系抽取
领域知识库
特征融合
隐含狄利克雷分布主题模型
下载PDF
职称材料
基于双重注意力机制的远程监督中文关系抽取
被引量:
10
10
作者
车金立
唐力伟
+1 位作者
邓士杰
苏续军
《计算机工程与应用》
CSCD
北大核心
2019年第20期107-113,共7页
相比于传统有监督的中文关系抽取方法,基于远程监督的方法可极大地避免训练语料匮乏的问题,因此得到了广泛关注。然而,远程监督方法的性能却严重受困于构建语料过程中引入的错误标签,因此为缓解噪声数据所带来的影响,提出一种基于双重...
相比于传统有监督的中文关系抽取方法,基于远程监督的方法可极大地避免训练语料匮乏的问题,因此得到了广泛关注。然而,远程监督方法的性能却严重受困于构建语料过程中引入的错误标签,因此为缓解噪声数据所带来的影响,提出一种基于双重注意力机制的关系抽取模型。该模型可通过双向门限循环单元(Bidirectional Gated Recurrent Unit,BI-GRU)网络获取训练实例的双向上下文语义信息,并利用字符级注意力机制关注实例中重要的语义特征,同时在多个实例间引入实例级注意力机制计算实例与对应关系的相关性,以降低噪声数据的权重。在基于互动百科构建的中文人物关系抽取语料上的实验结果表明,该模型相比于单注意力机制模型可有效利用实例中所包含的语义信息并降低错误标签实例的影响,获取更高的准确率。
展开更多
关键词
中文关系抽取
远程监督
双重注意力机制
双向门限循环单元(BI-GRU)
互动百科
下载PDF
职称材料
基于弱监督预训练CNN模型的情感分析方法
被引量:
9
11
作者
张越
夏鸿斌
《计算机工程与应用》
CSCD
北大核心
2018年第13期27-33,共7页
传统的情感分析研究大多基于机器学习算法,此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示,进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题,利用大规模弱监督数据来训练卷积...
传统的情感分析研究大多基于机器学习算法,此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示,进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题,利用大规模弱监督数据来训练卷积神经网络。同时引入"预训练-微调"策略,先在弱监督数据集上对卷积神经网络进行预训练,然后使用监督数据集进行微调训练来克服弱监督数据中的噪声问题。在SemEval-2013 Twitter情感分析数据集上进行实验验证,结果表明由于引入了弱监督数据参与训练,有效增强了卷积神经网络学习情感语义的能力,从而提升了模型的准确性。
展开更多
关键词
情感分析
弱监督
预训练-微调
卷积神经网络
下载PDF
职称材料
结合从句级远程监督与半监督集成学习的关系抽取方法
被引量:
9
12
作者
余小康
陈岭
+3 位作者
郭敬
蔡雅雅
吴勇
王敬昌
《模式识别与人工智能》
EI
CSCD
北大核心
2017年第1期54-63,共10页
针对传统基于远程监督的关系抽取方法中存在噪声和负例数据利用不足的问题,提出结合从句级远程监督和半监督集成学习的关系抽取方法.首先通过远程监督构建关系实例集,使用基于从句识别的去噪算法去除关系实例集中的噪声.然后抽取关系实...
针对传统基于远程监督的关系抽取方法中存在噪声和负例数据利用不足的问题,提出结合从句级远程监督和半监督集成学习的关系抽取方法.首先通过远程监督构建关系实例集,使用基于从句识别的去噪算法去除关系实例集中的噪声.然后抽取关系实例的词法特征并转化为分布式表征向量,构建特征数据集.最后选择特征数据集中所有正例数据和部分负例数据组成标注数据集,其余的负例数据组成未标注数据集,通过改进的半监督集成学习算法训练关系分类器.实验表明,相比基线方法,文中方法可以获得更高的分类准确率和召回率.
展开更多
关键词
关系抽取
远程监督
从句识别
去噪
半监督集成学习
下载PDF
职称材料
基于带噪观测的远监督神经网络关系抽取
被引量:
9
13
作者
叶育鑫
薛环
+1 位作者
王璐
欧阳丹彤
《软件学报》
EI
CSCD
北大核心
2020年第4期1025-1038,共14页
远监督关系抽取的最大优势是通过知识库和自然语言文本的自动对齐生成标记数据.这种简单的自动对齐机制在将人从繁重的样本标注工作中解放出来的同时,不可避免地会产生各种错误数据标记,进而影响构建高质量的关系抽取模型.针对远监督关...
远监督关系抽取的最大优势是通过知识库和自然语言文本的自动对齐生成标记数据.这种简单的自动对齐机制在将人从繁重的样本标注工作中解放出来的同时,不可避免地会产生各种错误数据标记,进而影响构建高质量的关系抽取模型.针对远监督关系抽取任务中的标记噪声问题,提出“最终句子对齐的标签是基于某些未知因素所生成的带噪观测结果”这一假设.并在此假设的基础上,构建由编码层、基于噪声分布的注意力层、真实标签输出层和带噪观测层的新型关系抽取模型.模型利用自动标记的数据学习真实标签到噪声标签的转移概率,并在测试阶段,通过真实标签输出层得到最终的关系分类.随后,研究带噪观测模型与深度神经网络的结合,重点讨论基于深度神经网络编码的噪声分布注意力机制以及深度神经网络框架下不均衡样本的降噪处理.通过以上研究,进一步提升基于带噪观测远监督关系抽取模型的抽取精度和鲁棒性.最后,在公测数据集和同等参数设置下进行带噪观测远监督关系抽取模型的验证实验,通过分析样本噪声的分布情况,对在各种样本噪声分布下的带噪观测模型进行性能评价,并与现有的主流基线方法进行比较.结果显示,所提出的带噪观测模型具有更高的准确率和召回率.
展开更多
关键词
远监督
关系抽取
噪声标签
下载PDF
职称材料
关系抽取综述
被引量:
9
14
作者
谢德鹏
常青
《计算机应用研究》
CSCD
北大核心
2020年第7期1921-1924,1930,共5页
关系抽取发展至今,总体上可以分为基于规则和基于统计的抽取方式;之后出现的众多方法大多是以统计为主,辅助以规则;后来引入了包括远程监督、深度学习等模式并融合了注意力机制、多标签多实例方法。对关系抽取的发展过程和方向以及以上...
关系抽取发展至今,总体上可以分为基于规则和基于统计的抽取方式;之后出现的众多方法大多是以统计为主,辅助以规则;后来引入了包括远程监督、深度学习等模式并融合了注意力机制、多标签多实例方法。对关系抽取的发展过程和方向以及以上提到的方法进行介绍和总结。
展开更多
关键词
关系抽取
有监督方法
无监督方法
半监督方法
远程监督
神经网络
联合抽取
下载PDF
职称材料
基于密集连接卷积神经网络的远程监督关系抽取
被引量:
8
15
作者
钱小梅
刘嘉勇
程芃森
《计算机科学》
CSCD
北大核心
2020年第2期157-162,共6页
密集连接卷积神经网络(DenseNet)是一种新型深度卷积神经网络架构,通过建立不同层间的连接关系,来确保网络层与层间最大程度的信息传输。在文本远程监督关系抽取任务中,针对现有神经网络方法使用浅层网络提取特征的局限,设计了一种基于...
密集连接卷积神经网络(DenseNet)是一种新型深度卷积神经网络架构,通过建立不同层间的连接关系,来确保网络层与层间最大程度的信息传输。在文本远程监督关系抽取任务中,针对现有神经网络方法使用浅层网络提取特征的局限,设计了一种基于密集连接方式的深度卷积神经网络模型。该模型采用五层卷积神经网络构成的密集连接模块和最大池化层作为句子编码器,通过合并不同层次的词法、句法和语义特征,来帮助网络学习特征,从而获取输入语句更丰富的语义信息,同时减轻深度神经网络的梯度消失现象,使得网络对自然语言的表征能力更强。模型在NYT-Freebase数据集上的平均准确率达到了82.5%,PR曲线面积达到了0.43。实验结果表明,该模型能够有效利用特征,并提高远程监督关系抽取的准确率。
展开更多
关键词
深度学习
关系抽取
远程监督
卷积神经网络
密集连接
下载PDF
职称材料
基于规则推理引擎的实体关系抽取研究
被引量:
8
16
作者
薛丽娟
席梦隆
+2 位作者
王梦婕
王昊奋
阮彤
《计算机科学与探索》
CSCD
北大核心
2016年第9期1310-1319,共10页
实体关系抽取是指从无结构的自然语言文本中抽取实体之间的语义关系,并以结构化的形式表示出来。传统的实体关系抽取方法只注重一种特定类型的数据源,并需要标注大量的训练数据来训练抽取模型,人工成本高。因此提出了一种综合多种数据源...
实体关系抽取是指从无结构的自然语言文本中抽取实体之间的语义关系,并以结构化的形式表示出来。传统的实体关系抽取方法只注重一种特定类型的数据源,并需要标注大量的训练数据来训练抽取模型,人工成本高。因此提出了一种综合多种数据源,并结合规则推理引擎的实体关系抽取方法,准确地说就是综合结构化和非结构化两种数据源,在结构化数据提供少量种子的情况下用规则推理引擎推理出更多的实体关系。然后使用远程监督学习方法从无结构的文本中抽取实体关系,通过多次迭代获得最终的实体关系。实验结果证明了该方法的有效性。
展开更多
关键词
关系抽取
关系推理
远程监督
规则推理引擎
下载PDF
职称材料
基于动态损失函数的远程监督关系抽取
被引量:
8
17
作者
彭正阳
吕立
于碧辉
《小型微型计算机系统》
CSCD
北大核心
2021年第2期251-255,共5页
关系抽取是信息抽取的主要任务之一,远程监督作为关系抽取中的一种有效的方法,已成功地应用于包含上千关系的大型语料库.然而,远程监督造成的错误标注会影响关系抽取的性能.为了缓解这一问题,现有的远程监督关系抽取方法选择每个实体对...
关系抽取是信息抽取的主要任务之一,远程监督作为关系抽取中的一种有效的方法,已成功地应用于包含上千关系的大型语料库.然而,远程监督造成的错误标注会影响关系抽取的性能.为了缓解这一问题,现有的远程监督关系抽取方法选择每个实体对中一个最好的句子或通过注意力机制赋予每个句子不同的权重.但这些方法并不能完全解决错误标注的问题.本文提出了一种新的方法来寻找错误标注或简单的实例,并通过动态改变损失函数的方式来降低它们在批量梯度下降中的权重.在NYT-Freebase公共数据集上的实验结果表明,本文提出的方法优于基线方法,能够有效提高远程监督关系抽取的准确率.
展开更多
关键词
信息抽取
关系抽取
远程监督
动态损失函数
下载PDF
职称材料
限定域关系抽取技术研究综述
被引量:
1
18
作者
侯景
邓晓梅
汉鹏武
《计算机科学》
CSCD
北大核心
2024年第1期252-265,共14页
限定域关系抽取技术是在预定义实体类型和关系类型的前提下,从文本中捕获关键信息的技术,多采用由头尾实体和关系构成的三元组作为信息表示形式。作为信息抽取领域的重要研究方向之一,其在知识问答、信息检索等任务中被广泛应用。文中...
限定域关系抽取技术是在预定义实体类型和关系类型的前提下,从文本中捕获关键信息的技术,多采用由头尾实体和关系构成的三元组作为信息表示形式。作为信息抽取领域的重要研究方向之一,其在知识问答、信息检索等任务中被广泛应用。文中在介绍相关概念和任务范式的基础上,分析了深度学习背景下限定域关系抽取任务的研究进展,根据句中实体是否可见,分为关系分类任务和三元组抽取任务,依据任务表现特征,前者可细分为有监督条件下的关系分类任务、小样本关系分类任务和远程监督条件下的关系分类任务。文中探讨和分析了以上任务中常用的技术方法及其优缺点,最后归纳总结了关系抽取技术在低资源、多模态等更为接近真实情景下的发展潜力和现存的挑战。
展开更多
关键词
限定域关系抽取
深度学习
关系分类
三元组
远程监督
下载PDF
职称材料
关系抽取中基于本体的远监督样本扩充
被引量:
7
19
作者
欧阳丹彤
瞿剑峰
叶育鑫
《软件学报》
EI
CSCD
北大核心
2014年第9期2088-2101,共14页
远监督学习是适合大数据下关系抽取任务的一种学习算法.它通过对齐知识库中的关系实例和文本集中的自然语句,为学习算法提供大规模样本数据.利用本体进行关系实例的自动扩充,用于解决基于远监督学习的关系抽取任务中部分待抽取关系的实...
远监督学习是适合大数据下关系抽取任务的一种学习算法.它通过对齐知识库中的关系实例和文本集中的自然语句,为学习算法提供大规模样本数据.利用本体进行关系实例的自动扩充,用于解决基于远监督学习的关系抽取任务中部分待抽取关系的实例匮乏问题.该方法首先通过定义关系覆盖率和公理容积率,来寻找与关系抽取任务关联性大的本体;然后,借助本体推理中的实例查询增加待抽取关系下的关系实例;最后,通过对齐新增关系实例和文本集中的自然语句,达到扩充样本的效果.实验结果表明:基于本体的远监督学习样本扩充方法能够有效完成样本匮乏的关系抽取任务,进一步提升远监督学习方法在大数据环境下的关系抽取能力.
展开更多
关键词
远监督
关系抽取
本体
下载PDF
职称材料
基于多层注意力机制的农业病虫害远程监督关系抽取研究
被引量:
7
20
作者
乐毅
王文宇
+5 位作者
张凯
梁振京
刘飞
陈祎琼
吴云志
张友华
《安徽农业大学学报》
CAS
CSCD
2020年第4期682-686,共5页
针对大多数现有关系抽取模型存在对语义特征提取不充分、速度慢且数据集匮乏的缺点,提出一种PCNN(piecewise convolutional neural network)模型和多层注意力机制相结合的远程监督关系抽取方法进行农业病虫害领域的关系抽取。模型由两...
针对大多数现有关系抽取模型存在对语义特征提取不充分、速度慢且数据集匮乏的缺点,提出一种PCNN(piecewise convolutional neural network)模型和多层注意力机制相结合的远程监督关系抽取方法进行农业病虫害领域的关系抽取。模型由两个实体把句子分成三段,对卷积后的每一段进行最大池化获得特征,同时在实例和池化特征层面上分别引入注意力机制有效降低信息噪声。在F1评价指标上比传统方法提高了5.75%,在耗时上是传统方法的10.93%,且减少了手工标注数据集的成本。
展开更多
关键词
关系抽取
农业病虫害
注意力机制
卷积神经网络
远程监督
下载PDF
职称材料
题名
实体关系抽取综述
被引量:
27
1
作者
王传栋
徐娇
张永
机构
南京邮电大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2020年第12期25-36,共12页
文摘
实体关系抽取作为信息抽取任务的重要组成之一,能够对更小粒度的信息进行语义分析,为更多任务提供数据支持。关系抽取发展至今,总体可分为基于传统机器学习和基于深度学习两种方式。基于传统机器学习的关系抽取研究主要以统计和基于规则相结合的方法为主。基于深度学习的框架通过引入远程监督、小样本学习、注意力机制、强化学习、多示例多标记学习等方法取得了丰富的研究成果。回顾实体关系抽取的发展历程,对每种模型进行分析和讨论;结合深度学习方法的最新动态,对实体关系抽取未来的研究方向和趋势进行展望。
关键词
实体关系抽取
机器学习
远程监督
图卷积网络
强化学习
神经网络
Keywords
entity
relation
extraction
machine
learning
distant
supervision
graph
convolutional
network
reinforcement
learning
neural
network
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于深度学习的关系抽取研究综述
被引量:
24
2
作者
庄传志
靳小龙
朱伟建
刘静伟
白龙
程学旗
机构
中国科学院计算技术研究所
中国科学院大学计算机与控制学院
出处
《中文信息学报》
CSCD
北大核心
2019年第12期1-18,共18页
基金
国家重点研发计划(2016YFB1000902)
国家自然科学基金(61772501,61572473,61572469,91646120)
文摘
关系抽取(RE)是为了抽取文本中包含的关系,是信息抽取(IE)的重要组成部分。近年来,研究人员利用深度学习技术在该领域开展了深入研究。由于神经网络类型丰富,基于深度学习的关系抽取方法也更加多样。该文从关系抽取的基本概念出发,对关系抽取方法依据不同的视角进行了类别划分。随后,介绍了基于深度学习的关系抽取方法常用的数据集,并总结出基于深度学习的关系抽取框架。在此框架下,对关系抽取方法在面向深度学习的输入数据预处理、面向深度学习的神经网络模型设计等方面的具体工作进行了分析与评述,最后对未来的研究方向进行了探讨和展望。
关键词
关系抽取
深度学习
远程监督
联合学习
Keywords
relation
extraction
deep
learning
distant
supervision
joint
learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
远程监督关系抽取综述
被引量:
20
3
作者
杨穗珠
刘艳霞
张凯文
洪吟
黄翰
机构
华南理工大学软件工程
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2021年第8期1636-1660,共25页
基金
国家自然科学基金(61876208)
广东省重点研发项目(2018B010109003)
广州市科技计划(201802010007,201804010276)资助
文摘
远程监督可以为关系抽取任务自动构建数据集,缓解了人工构建数据集的压力和成本,为自动关系抽取的实现奠定基础,然而使用远程监督方法构建的数据集存在错误标注以及长尾问题,严重影响关系抽取性能。目前,远程监督关系抽取任务的主要研究方向为关系模型的降噪手段以及对长尾关系的处理方法。近年来,随着深度学习技术的发展,这两个领域的研究工作也迎来了新一轮的机遇与挑战。本文对近几年远程监督关系抽取的研究进展进行综述,针对基于深度学习的远程监督关系抽取任务定义常用工作流,其中包括样本降噪、外部信息融合、编码器和分类器。本文根据不同的模块将已有的研究成果进行分类和梳理,分析比较主要方法,整理其中的关键问题,介绍已有的解决方案和相关数据集,总结远程监督关系抽取任务所用评测指标与评估方式,展望未来研究趋势。
关键词
关系抽取
信息抽取
远程监督
降噪
长尾现象
错误标注
Keywords
relation
extraction
information
extraction
distant
supervision
noise
reduction
long
tail
wrong
labelling
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于改进注意力机制的实体关系抽取方法
被引量:
18
4
作者
冯建周
宋沙沙
王元卓
刘亚坤
武红颖
龚昊
机构
燕山大学信息科学与工程学院
中国科学院计算技术研究所
出处
《电子学报》
EI
CAS
CSCD
北大核心
2019年第8期1692-1700,共9页
基金
国家自然科学基金青年基金(No.61602401)
河北省教育厅高等学校科技计划青年基金项目(自然类)(No.QN2018074)
文摘
实体关系抽取是知识库构建中至关重要的一个环节.在众多的实体关系抽取方法中,远程监督结合神经网络模型的方法在准确率等性能上是比较令人满意的,但远程监督获取的标注语料中往往存在大量的噪声数据,给实体关系抽取模型的训练带来了很大的影响.本文提出一种基于改进注意力机制的卷积神经网络实体关系抽取模型.该模型针对包含同一实体对的句子集合,从中尽可能地找出所有体现该实体对关系的正实例,构建组合句子向量,抛弃可能的噪声句子,从而最大程度地降低噪声句子的影响又能充分利用正实例的语义信息.实验证明,本文提出的关系抽取模型在准确率上优于对比的关系抽取模型.
关键词
关系抽取
改进注意力机制
卷积神经网络
远程监督
组合句子特征向量
Keywords
relation
extraction
improved
attention
mechanism
convolutional
neural
networks
distant
supervision
combined
sentence
feature
vector
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于远程监督的关系抽取研究综述
被引量:
17
5
作者
白龙
靳小龙
席鹏弼
程学旗
机构
中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室
中国科学院大学计算机与控制学院
出处
《中文信息学报》
CSCD
北大核心
2019年第10期10-17,共8页
基金
国家重点研发计划(2016YFB1000902)
国家自然科学基金(61772501,61572473,61572469,91646120)
文摘
关系抽取作为信息抽取的一项关键技术,在知识库自动构建、问答系统等领域有着极为重要的意义,一直以来受到人们的关注。远程监督关系抽取技术通过外部知识库作为监督源,自动对语料库进行标注,能够大量节省人工标注成本,因而受到了研究者们的重视。该文针对远程监督关系抽取技术做了较为系统性的梳理,将已有方法分为基于概率图的、基于矩阵补全的和基于嵌入的三大类,并且对其当前面临的挑战进行了探讨,最后总结并展望了远程监督关系抽取技术未来的发展。
关键词
远程监督
关系抽取
信息抽取
Keywords
distant
supervision
relation
extraction
information
extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于GRU和注意力机制的远程监督关系抽取
被引量:
14
6
作者
黄兆玮
常亮
宾辰忠
孙彦鹏
孙磊
机构
桂林电子科技大学广西可信软件重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2019年第10期2930-2933,共4页
基金
国家自然科学基金资助项目(U1501252,61572146)
广西创新驱动重大专项项目(AA17202024)
+1 种基金
广西自然科学基金资助项目(2016GXNSFDA380006)
广西信息科学实验中心平台建设项目(PT1601)
文摘
随着深度学习的发展,越来越多的深度学习模型被运用到了关系提取的任务中,但是传统的深度学习模型无法解决长距离依赖问题;同时,远程监督将会不可避免地产生错误标签。针对以上两个问题,提出一种基于GRU(gated recurrent unit)和注意力机制的远程监督关系抽取方法。首先通过使用GRU神经网络来提取文本特征,解决长距离依赖问题;接着在实体对上构建句子级的注意力机制,减小噪声句子的权重;最后在真实的数据集上,通过计算准确率、召回率并绘出PR曲线证明该方法与现有的一些方法相比,取得了比较显著的进步。
关键词
深度学习
远程监督
门控循环单元
注意力机制
Keywords
deep
learning
distant
supervision
GRU
attention
mechanism
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于远程监督的人物属性抽取研究
被引量:
11
7
作者
马进
杨一帆
陈文亮
机构
苏州大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2020年第6期64-72,共9页
基金
国家自然科学基金(61525205,61876115)
文摘
属性抽取的主要目标是从非结构化文本中获取实体的属性值。为了从文本中抽取出人物属性,通常需要大量的标注数据,然而这些数据资源却十分稀少。为了解决这个问题,该文从百科类网页的表格数据出发,构建了人物属性表,然后采用远程监督的方法得到大规模、多类别的人物属性标注语料,从而免去了人工标注的繁琐流程。针对新构建的数据集,分别使用条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)构建了属性抽取的两个基线模型。实验结果表明,BiLSTM-CRF取得比CRF更好的性能,其中BiLSTM-CRF的平均F1值为83.39%。
关键词
属性抽取
标注数据
远程监督
Keywords
attribute
recognition
annotated
data
distant
supervision
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于远程监督的多因子人物关系抽取模型
被引量:
10
8
作者
黄杨琛
贾焰
甘亮
徐菁
黄九鸣
赫中翮
机构
国防科技大学计算机学院
湖南星汉数智科技有限公司知识图谱研发部
出处
《通信学报》
EI
CSCD
北大核心
2018年第7期103-112,共10页
基金
国家重点研究发展计划基金资助项目(No.2016QY03D0601
No.2016QY03D0603)
+1 种基金
国家自然科学基金资助项目(No.61502517)
湖南省重点研发计划基金资助项目(No.2018GK2056)~~
文摘
针对远程监督的基本假设过强容易引入噪声数据的问题,提出了一种可以对远程监督自动生成的训练数据去噪的人物实体关系抽取模型。在训练数据生成阶段,通过多示例学习的思想和基于TF-IDF的关系指示词发现的方法对远程监督产生的数据进行去噪处理,使训练数据达到人工标注质量。在模型分类器中,提出采用词法特征和句法特征相结合的多因子特征作为关系特征向量用于分类器的学习。在大规模真实数据集上的实验结果表明,所提模型结果优于同类型的关系抽取方法。
关键词
关系抽取
人物关系
远程监督
机器学习
自然语言处理
Keywords
relation
extraction
person
entity
relation
distant
supervision
machine
learning
natural
language
processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合多特征的基于远程监督的中文领域实体关系抽取
被引量:
10
9
作者
王斌
郭剑毅
线岩团
王红斌
余正涛
机构
昆明理工大学信息工程与自动化学院
昆明理工大学智能信息处理重点实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2019年第2期133-143,共11页
基金
国家自然科学基金项目(No.61562052
61363044
61462054)资助~~
文摘
针对从未标记的文本中抽取中文领域实体关系的问题,文中提出基于远程监督的领域实体属性关系抽取的混合方法,利用知识库中已有结构化的关系三元组,从自然语言文本中自动获取训练语料.针对远程监督方法标注数据存在大量噪声的问题,采用隐含狄利克雷分布主题模型抽取主题关键词,再与关系类型进行相似度计算和对关键词模式匹配进行去噪.最后提取词性特征、依存关系特征和短语句法树特征,并进行融合,训练关系抽取模型.实验表明,3种特征融合的F值较高,抽取性能较好.
关键词
远程监督
实体关系抽取
领域知识库
特征融合
隐含狄利克雷分布主题模型
Keywords
distant
supervision
Entity
Relation
Extraction
Domain
Knowledge
Base
Feature
Fusion
Latent
Dirichlet
Allocation
Topic
Model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于双重注意力机制的远程监督中文关系抽取
被引量:
10
10
作者
车金立
唐力伟
邓士杰
苏续军
机构
陆军工程大学石家庄校区火炮工程系
出处
《计算机工程与应用》
CSCD
北大核心
2019年第20期107-113,共7页
基金
国家自然科学基金(No.51575523)
军内科研基金
文摘
相比于传统有监督的中文关系抽取方法,基于远程监督的方法可极大地避免训练语料匮乏的问题,因此得到了广泛关注。然而,远程监督方法的性能却严重受困于构建语料过程中引入的错误标签,因此为缓解噪声数据所带来的影响,提出一种基于双重注意力机制的关系抽取模型。该模型可通过双向门限循环单元(Bidirectional Gated Recurrent Unit,BI-GRU)网络获取训练实例的双向上下文语义信息,并利用字符级注意力机制关注实例中重要的语义特征,同时在多个实例间引入实例级注意力机制计算实例与对应关系的相关性,以降低噪声数据的权重。在基于互动百科构建的中文人物关系抽取语料上的实验结果表明,该模型相比于单注意力机制模型可有效利用实例中所包含的语义信息并降低错误标签实例的影响,获取更高的准确率。
关键词
中文关系抽取
远程监督
双重注意力机制
双向门限循环单元(BI-GRU)
互动百科
Keywords
Chinese
relation
extraction
distant
supervision
dual
attention
mechanism
Bidirectional
Gated
Recurrent
Unit(BI-GRU)
hudong
encyclopedia
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于弱监督预训练CNN模型的情感分析方法
被引量:
9
11
作者
张越
夏鸿斌
机构
江南大学数字媒体学院
江苏省媒体设计与软件技术重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2018年第13期27-33,共7页
基金
国家科学支撑计划课题(No.2015BAH54F01)
文摘
传统的情感分析研究大多基于机器学习算法,此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示,进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题,利用大规模弱监督数据来训练卷积神经网络。同时引入"预训练-微调"策略,先在弱监督数据集上对卷积神经网络进行预训练,然后使用监督数据集进行微调训练来克服弱监督数据中的噪声问题。在SemEval-2013 Twitter情感分析数据集上进行实验验证,结果表明由于引入了弱监督数据参与训练,有效增强了卷积神经网络学习情感语义的能力,从而提升了模型的准确性。
关键词
情感分析
弱监督
预训练-微调
卷积神经网络
Keywords
sentiment
analysis
distant
supervision
pre-train-fine-tune
Convolutional
Neural
Networks(CNN)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
结合从句级远程监督与半监督集成学习的关系抽取方法
被引量:
9
12
作者
余小康
陈岭
郭敬
蔡雅雅
吴勇
王敬昌
机构
浙江大学计算机科学与技术学院
浙江鸿程计算机系统有限公司
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2017年第1期54-63,共10页
基金
国家自然科学基金项目(No.61332017
60703040)
+3 种基金
浙江省重大科技专项(No.2015C33002
2013C01046
2011C13042)
中国工程科技知识中心项目(No.CKCEST-2014-1-5)资助~~
文摘
针对传统基于远程监督的关系抽取方法中存在噪声和负例数据利用不足的问题,提出结合从句级远程监督和半监督集成学习的关系抽取方法.首先通过远程监督构建关系实例集,使用基于从句识别的去噪算法去除关系实例集中的噪声.然后抽取关系实例的词法特征并转化为分布式表征向量,构建特征数据集.最后选择特征数据集中所有正例数据和部分负例数据组成标注数据集,其余的负例数据组成未标注数据集,通过改进的半监督集成学习算法训练关系分类器.实验表明,相比基线方法,文中方法可以获得更高的分类准确率和召回率.
关键词
关系抽取
远程监督
从句识别
去噪
半监督集成学习
Keywords
Relation
Extraction,
distant
supervision
,
Clause
Identification,
Noise
Reduction,Semi-supervised
Ensemble
Learning
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于带噪观测的远监督神经网络关系抽取
被引量:
9
13
作者
叶育鑫
薛环
王璐
欧阳丹彤
机构
吉林大学计算机科学与技术学院
符号计算与知识工程教育部重点实验室(吉林大学)
北京大学北京国际数学研究中心
出处
《软件学报》
EI
CSCD
北大核心
2020年第4期1025-1038,共14页
基金
国家自然科学基金(61672261,61872159)。
文摘
远监督关系抽取的最大优势是通过知识库和自然语言文本的自动对齐生成标记数据.这种简单的自动对齐机制在将人从繁重的样本标注工作中解放出来的同时,不可避免地会产生各种错误数据标记,进而影响构建高质量的关系抽取模型.针对远监督关系抽取任务中的标记噪声问题,提出“最终句子对齐的标签是基于某些未知因素所生成的带噪观测结果”这一假设.并在此假设的基础上,构建由编码层、基于噪声分布的注意力层、真实标签输出层和带噪观测层的新型关系抽取模型.模型利用自动标记的数据学习真实标签到噪声标签的转移概率,并在测试阶段,通过真实标签输出层得到最终的关系分类.随后,研究带噪观测模型与深度神经网络的结合,重点讨论基于深度神经网络编码的噪声分布注意力机制以及深度神经网络框架下不均衡样本的降噪处理.通过以上研究,进一步提升基于带噪观测远监督关系抽取模型的抽取精度和鲁棒性.最后,在公测数据集和同等参数设置下进行带噪观测远监督关系抽取模型的验证实验,通过分析样本噪声的分布情况,对在各种样本噪声分布下的带噪观测模型进行性能评价,并与现有的主流基线方法进行比较.结果显示,所提出的带噪观测模型具有更高的准确率和召回率.
关键词
远监督
关系抽取
噪声标签
Keywords
distant
supervision
relation
extraction
noise
label
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
关系抽取综述
被引量:
9
14
作者
谢德鹏
常青
机构
中国航天科工集团第二研究院研究生院
北京计算机技术及应用研究所
出处
《计算机应用研究》
CSCD
北大核心
2020年第7期1921-1924,1930,共5页
文摘
关系抽取发展至今,总体上可以分为基于规则和基于统计的抽取方式;之后出现的众多方法大多是以统计为主,辅助以规则;后来引入了包括远程监督、深度学习等模式并融合了注意力机制、多标签多实例方法。对关系抽取的发展过程和方向以及以上提到的方法进行介绍和总结。
关键词
关系抽取
有监督方法
无监督方法
半监督方法
远程监督
神经网络
联合抽取
Keywords
relation
extraction
supervised
relation
method
unsupervised
relation
method
semi-supervised
relation
method
distant
supervision
neural
network
joint
extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于密集连接卷积神经网络的远程监督关系抽取
被引量:
8
15
作者
钱小梅
刘嘉勇
程芃森
机构
四川大学网络空间安全学院
中国科学院信息工程研究所中国科学院网络测评技术重点实验室
出处
《计算机科学》
CSCD
北大核心
2020年第2期157-162,共6页
基金
中国科学院网络测评技术重点实验室开放课题基金(NST-18-001)~~
文摘
密集连接卷积神经网络(DenseNet)是一种新型深度卷积神经网络架构,通过建立不同层间的连接关系,来确保网络层与层间最大程度的信息传输。在文本远程监督关系抽取任务中,针对现有神经网络方法使用浅层网络提取特征的局限,设计了一种基于密集连接方式的深度卷积神经网络模型。该模型采用五层卷积神经网络构成的密集连接模块和最大池化层作为句子编码器,通过合并不同层次的词法、句法和语义特征,来帮助网络学习特征,从而获取输入语句更丰富的语义信息,同时减轻深度神经网络的梯度消失现象,使得网络对自然语言的表征能力更强。模型在NYT-Freebase数据集上的平均准确率达到了82.5%,PR曲线面积达到了0.43。实验结果表明,该模型能够有效利用特征,并提高远程监督关系抽取的准确率。
关键词
深度学习
关系抽取
远程监督
卷积神经网络
密集连接
Keywords
Deep
learning
Relation
extraction
distant
supervision
Convolutional
neural
network
Dense
connectivity
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于规则推理引擎的实体关系抽取研究
被引量:
8
16
作者
薛丽娟
席梦隆
王梦婕
王昊奋
阮彤
机构
华东理工大学信息科学与工程学院
出处
《计算机科学与探索》
CSCD
北大核心
2016年第9期1310-1319,共10页
基金
上海市经信委"软件和集成电路产业发展专项资金"No.140304~~
文摘
实体关系抽取是指从无结构的自然语言文本中抽取实体之间的语义关系,并以结构化的形式表示出来。传统的实体关系抽取方法只注重一种特定类型的数据源,并需要标注大量的训练数据来训练抽取模型,人工成本高。因此提出了一种综合多种数据源,并结合规则推理引擎的实体关系抽取方法,准确地说就是综合结构化和非结构化两种数据源,在结构化数据提供少量种子的情况下用规则推理引擎推理出更多的实体关系。然后使用远程监督学习方法从无结构的文本中抽取实体关系,通过多次迭代获得最终的实体关系。实验结果证明了该方法的有效性。
关键词
关系抽取
关系推理
远程监督
规则推理引擎
Keywords
relation
extraction
relation
reasoning
distant
supervision
rule-based
inference
engine
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于动态损失函数的远程监督关系抽取
被引量:
8
17
作者
彭正阳
吕立
于碧辉
机构
中国科学院大学
中国科学院沈阳计算技术研究所
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第2期251-255,共5页
文摘
关系抽取是信息抽取的主要任务之一,远程监督作为关系抽取中的一种有效的方法,已成功地应用于包含上千关系的大型语料库.然而,远程监督造成的错误标注会影响关系抽取的性能.为了缓解这一问题,现有的远程监督关系抽取方法选择每个实体对中一个最好的句子或通过注意力机制赋予每个句子不同的权重.但这些方法并不能完全解决错误标注的问题.本文提出了一种新的方法来寻找错误标注或简单的实例,并通过动态改变损失函数的方式来降低它们在批量梯度下降中的权重.在NYT-Freebase公共数据集上的实验结果表明,本文提出的方法优于基线方法,能够有效提高远程监督关系抽取的准确率.
关键词
信息抽取
关系抽取
远程监督
动态损失函数
Keywords
information
extraction
relation
extraction
distant
supervision
dynamic
loss
function
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
限定域关系抽取技术研究综述
被引量:
1
18
作者
侯景
邓晓梅
汉鹏武
机构
中国科学院空间应用工程与技术中心
中国科学院大学
出处
《计算机科学》
CSCD
北大核心
2024年第1期252-265,共14页
文摘
限定域关系抽取技术是在预定义实体类型和关系类型的前提下,从文本中捕获关键信息的技术,多采用由头尾实体和关系构成的三元组作为信息表示形式。作为信息抽取领域的重要研究方向之一,其在知识问答、信息检索等任务中被广泛应用。文中在介绍相关概念和任务范式的基础上,分析了深度学习背景下限定域关系抽取任务的研究进展,根据句中实体是否可见,分为关系分类任务和三元组抽取任务,依据任务表现特征,前者可细分为有监督条件下的关系分类任务、小样本关系分类任务和远程监督条件下的关系分类任务。文中探讨和分析了以上任务中常用的技术方法及其优缺点,最后归纳总结了关系抽取技术在低资源、多模态等更为接近真实情景下的发展潜力和现存的挑战。
关键词
限定域关系抽取
深度学习
关系分类
三元组
远程监督
Keywords
Domain-limited
Deep
learning
Relation
classification
Triples
distant
supervision
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
关系抽取中基于本体的远监督样本扩充
被引量:
7
19
作者
欧阳丹彤
瞿剑峰
叶育鑫
机构
吉林大学计算机科学与技术学院
符号计算与知识工程教育部重点实验室(吉林大学)
吉林大学国家地球物理探测仪器工程技术研究中心
出处
《软件学报》
EI
CSCD
北大核心
2014年第9期2088-2101,共14页
基金
国家自然科学基金(61272208
61133011
+2 种基金
41172294
61170092)
吉林省科技发展计划(201201011)
文摘
远监督学习是适合大数据下关系抽取任务的一种学习算法.它通过对齐知识库中的关系实例和文本集中的自然语句,为学习算法提供大规模样本数据.利用本体进行关系实例的自动扩充,用于解决基于远监督学习的关系抽取任务中部分待抽取关系的实例匮乏问题.该方法首先通过定义关系覆盖率和公理容积率,来寻找与关系抽取任务关联性大的本体;然后,借助本体推理中的实例查询增加待抽取关系下的关系实例;最后,通过对齐新增关系实例和文本集中的自然语句,达到扩充样本的效果.实验结果表明:基于本体的远监督学习样本扩充方法能够有效完成样本匮乏的关系抽取任务,进一步提升远监督学习方法在大数据环境下的关系抽取能力.
关键词
远监督
关系抽取
本体
Keywords
distant
supervision
relation
extraction
ontology
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于多层注意力机制的农业病虫害远程监督关系抽取研究
被引量:
7
20
作者
乐毅
王文宇
张凯
梁振京
刘飞
陈祎琼
吴云志
张友华
机构
安徽农业大学信息与计算机学院
安徽农业大学
安徽农业大学植物保护学院
出处
《安徽农业大学学报》
CAS
CSCD
2020年第4期682-686,共5页
基金
安徽农业大学大创项目[XJDC2019206]
安徽省大学生创新创业教育训练计划项目[201910364206]
安徽省级教学团队计算机科学与技术教学团队项目[2018JXTD114]共同资助。
文摘
针对大多数现有关系抽取模型存在对语义特征提取不充分、速度慢且数据集匮乏的缺点,提出一种PCNN(piecewise convolutional neural network)模型和多层注意力机制相结合的远程监督关系抽取方法进行农业病虫害领域的关系抽取。模型由两个实体把句子分成三段,对卷积后的每一段进行最大池化获得特征,同时在实例和池化特征层面上分别引入注意力机制有效降低信息噪声。在F1评价指标上比传统方法提高了5.75%,在耗时上是传统方法的10.93%,且减少了手工标注数据集的成本。
关键词
关系抽取
农业病虫害
注意力机制
卷积神经网络
远程监督
Keywords
relation
extraction
agricultural
pest
and
disease
attention
mechanism
convolutional
neural
network
distant
supervision
分类号
S126 [农业科学—农业基础科学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
实体关系抽取综述
王传栋
徐娇
张永
《计算机工程与应用》
CSCD
北大核心
2020
27
下载PDF
职称材料
2
基于深度学习的关系抽取研究综述
庄传志
靳小龙
朱伟建
刘静伟
白龙
程学旗
《中文信息学报》
CSCD
北大核心
2019
24
下载PDF
职称材料
3
远程监督关系抽取综述
杨穗珠
刘艳霞
张凯文
洪吟
黄翰
《计算机学报》
EI
CAS
CSCD
北大核心
2021
20
下载PDF
职称材料
4
基于改进注意力机制的实体关系抽取方法
冯建周
宋沙沙
王元卓
刘亚坤
武红颖
龚昊
《电子学报》
EI
CAS
CSCD
北大核心
2019
18
下载PDF
职称材料
5
基于远程监督的关系抽取研究综述
白龙
靳小龙
席鹏弼
程学旗
《中文信息学报》
CSCD
北大核心
2019
17
下载PDF
职称材料
6
基于GRU和注意力机制的远程监督关系抽取
黄兆玮
常亮
宾辰忠
孙彦鹏
孙磊
《计算机应用研究》
CSCD
北大核心
2019
14
下载PDF
职称材料
7
基于远程监督的人物属性抽取研究
马进
杨一帆
陈文亮
《中文信息学报》
CSCD
北大核心
2020
11
下载PDF
职称材料
8
基于远程监督的多因子人物关系抽取模型
黄杨琛
贾焰
甘亮
徐菁
黄九鸣
赫中翮
《通信学报》
EI
CSCD
北大核心
2018
10
下载PDF
职称材料
9
融合多特征的基于远程监督的中文领域实体关系抽取
王斌
郭剑毅
线岩团
王红斌
余正涛
《模式识别与人工智能》
EI
CSCD
北大核心
2019
10
下载PDF
职称材料
10
基于双重注意力机制的远程监督中文关系抽取
车金立
唐力伟
邓士杰
苏续军
《计算机工程与应用》
CSCD
北大核心
2019
10
下载PDF
职称材料
11
基于弱监督预训练CNN模型的情感分析方法
张越
夏鸿斌
《计算机工程与应用》
CSCD
北大核心
2018
9
下载PDF
职称材料
12
结合从句级远程监督与半监督集成学习的关系抽取方法
余小康
陈岭
郭敬
蔡雅雅
吴勇
王敬昌
《模式识别与人工智能》
EI
CSCD
北大核心
2017
9
下载PDF
职称材料
13
基于带噪观测的远监督神经网络关系抽取
叶育鑫
薛环
王璐
欧阳丹彤
《软件学报》
EI
CSCD
北大核心
2020
9
下载PDF
职称材料
14
关系抽取综述
谢德鹏
常青
《计算机应用研究》
CSCD
北大核心
2020
9
下载PDF
职称材料
15
基于密集连接卷积神经网络的远程监督关系抽取
钱小梅
刘嘉勇
程芃森
《计算机科学》
CSCD
北大核心
2020
8
下载PDF
职称材料
16
基于规则推理引擎的实体关系抽取研究
薛丽娟
席梦隆
王梦婕
王昊奋
阮彤
《计算机科学与探索》
CSCD
北大核心
2016
8
下载PDF
职称材料
17
基于动态损失函数的远程监督关系抽取
彭正阳
吕立
于碧辉
《小型微型计算机系统》
CSCD
北大核心
2021
8
下载PDF
职称材料
18
限定域关系抽取技术研究综述
侯景
邓晓梅
汉鹏武
《计算机科学》
CSCD
北大核心
2024
1
下载PDF
职称材料
19
关系抽取中基于本体的远监督样本扩充
欧阳丹彤
瞿剑峰
叶育鑫
《软件学报》
EI
CSCD
北大核心
2014
7
下载PDF
职称材料
20
基于多层注意力机制的农业病虫害远程监督关系抽取研究
乐毅
王文宇
张凯
梁振京
刘飞
陈祎琼
吴云志
张友华
《安徽农业大学学报》
CAS
CSCD
2020
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
6
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部