期刊文献+
共找到669篇文章
< 1 2 34 >
每页显示 20 50 100
一种准确而高效的领域知识图谱构建方法 被引量:126
1
作者 杨玉基 许斌 +3 位作者 胡家威 仝美涵 张鹏 郑莉 《软件学报》 EI CSCD 北大核心 2018年第10期2931-2947,共17页
作为语义网的数据支撑,知识图谱在知识问答、语义搜索等领域起着至关重要的作用,一直以来也是研究领域和工程领域的一个热点问题,但是,构建一个质量较高、规模较大的知识图谱往往需要花费巨大的人力和时间成本.如何平衡准确率和效率、... 作为语义网的数据支撑,知识图谱在知识问答、语义搜索等领域起着至关重要的作用,一直以来也是研究领域和工程领域的一个热点问题,但是,构建一个质量较高、规模较大的知识图谱往往需要花费巨大的人力和时间成本.如何平衡准确率和效率、快速地构建出一个高质量的领域知识图谱,是知识工程领域的一个重要挑战.对领域知识图谱构建方法进行了系统研究,提出了一种准确、高效的领域知识图谱构建方法——"四步法",将该方法应用到中国基础教育九门学科知识图谱的构建中,在较短时间内构建出了准确率较高的学科知识图谱,证明了该方法构建领域知识图谱的有效性.以地理学科知识图谱为例,使用"四步法"共得到67万个实例、1 421万条三元组,其中,标注数据的学科知识覆盖率和知识准确率均在99%以上. 展开更多
关键词 语义网 知识图谱 本体 语义标注 实体集扩充 关系抽取
下载PDF
信息抽取研究综述 被引量:83
2
作者 郭喜跃 何婷婷 《计算机科学》 CSCD 北大核心 2015年第2期14-17,38,共5页
信息抽取的任务是从大量数据中准确、快速地获取目标信息,提高信息的利用率。目前,信息抽取已经成为NLP领域的一个重要分支。随着互联网应用的发展,其价值也正日益显现,学术界和工业界对此都寄予厚望。首先回顾了信息抽取的发展历程;接... 信息抽取的任务是从大量数据中准确、快速地获取目标信息,提高信息的利用率。目前,信息抽取已经成为NLP领域的一个重要分支。随着互联网应用的发展,其价值也正日益显现,学术界和工业界对此都寄予厚望。首先回顾了信息抽取的发展历程;接着从命名实体识别、指代消解、关系抽取和事件抽取4个方面总结了信息抽取关键技术的研究进展;然后分析了信息抽取目前面临的若干主要问题;最后对信息抽取的研究趋势作了预测。 展开更多
关键词 信息抽取 命名实体识别 指代消解 关系抽取 事件抽取
下载PDF
基于Deep Belief Nets的中文名实体关系抽取 被引量:70
3
作者 陈宇 郑德权 赵铁军 《软件学报》 EI CSCD 北大核心 2012年第10期2572-2585,共14页
关系抽取是信息抽取的一项子任务,用以识别文本中实体之间的语义关系.提出一种利用DBN(deepbelief nets)模型进行基于特征的实体关系抽取方法,该模型是由多层无监督的RBM(restricted Boltzmann machine)网络和一层有监督的BP(back-propa... 关系抽取是信息抽取的一项子任务,用以识别文本中实体之间的语义关系.提出一种利用DBN(deepbelief nets)模型进行基于特征的实体关系抽取方法,该模型是由多层无监督的RBM(restricted Boltzmann machine)网络和一层有监督的BP(back-propagation)网络组成的神经网络分类器.RBM网络以确保特征向量映射达到最优,最后一层BP网络分类RBM网络的输出特征向量,从而训练实体关系分类器.在ACE04语料上进行的相关测试,一方面证明了字特征比词特征更适用于中文关系抽取任务;另一方面设计了3组不同的实验,分别使用正确的实体类别信息、通过实体类型分类器得到实体类型信息和不使用实体类型信息,用以比较实体类型信息对关系抽取效果的影响.实验结果表明,DBN非常适用于基于高维空间特征的信息抽取任务,获得的效果比SVM和反向传播网络更好. 展开更多
关键词 DBN(deep BELIEF nets) 神经网络 关系抽取 深层网络 字特征
下载PDF
基于核函数中文关系自动抽取系统的实现 被引量:58
4
作者 刘克彬 李芳 +1 位作者 刘磊 韩颖 《计算机研究与发展》 EI CSCD 北大核心 2007年第8期1406-1411,共6页
实体关系抽取是信息抽取的重要组成部分.基于核函数的中文实体关系自动抽取系统应用改进的语义序列核函数,结合KNN机器学习算法构造分类器来分类并标注关系的类型.通过对ACE评测定义的三大类6子类实体关系的抽取,关系抽取的平均精度可... 实体关系抽取是信息抽取的重要组成部分.基于核函数的中文实体关系自动抽取系统应用改进的语义序列核函数,结合KNN机器学习算法构造分类器来分类并标注关系的类型.通过对ACE评测定义的三大类6子类实体关系的抽取,关系抽取的平均精度可以达到88%,明显高于基于特征向量和传统的序列核函数方法,该方法适合小训练集,易于学习新的实体关系.系统由8个独立的模块构成,便于维护和升级.系统既可以独立运行,也可以嵌入在开放的文本处理平台GATE环境.为了更好地利用关系抽取的结果,系统扩展传统的二元关系,抽取关系的同时,抽取该关系的描述,形成完整的中文实体关系抽取系统. 展开更多
关键词 关系抽取 核函数 信息抽取 语义 机器学习
下载PDF
基于注意力机制的LSTM的语义关系抽取 被引量:64
5
作者 王红 史金钏 张志伟 《计算机应用研究》 CSCD 北大核心 2018年第5期1417-1420,1440,共5页
目前关系抽取方法中,传统深度学习方法存在长距离依赖问题,并且未考虑模型输入与输出的相关性。针对以上问题,提出了一种将LSTM(long short-term memory)模型与注意力机制相结合的关系抽取方法。将文本信息向量化,提取文本局部特征,再... 目前关系抽取方法中,传统深度学习方法存在长距离依赖问题,并且未考虑模型输入与输出的相关性。针对以上问题,提出了一种将LSTM(long short-term memory)模型与注意力机制相结合的关系抽取方法。将文本信息向量化,提取文本局部特征,再将文本局部特征导入双向LSTM模型中,通过注意力机制对LSTM模型的输入与输出之间的相关性进行重要度计算,根据重要度获取文本整体特征;最后将局部特征和整体特征进行特征融合,通过分类器输出分类结果。在Sem Eval-2010 task 8语料库上的实验结果表明,该方法的准确率和稳定性较传统深度学习方法有进一步提高,为自动问答、信息检索以及本体学习等领域提供了方法支持。 展开更多
关键词 文本信息 语义关系 关系抽取 LSTM 注意力机制
下载PDF
中文网页语义标注:由句子到RDF表示 被引量:31
6
作者 荆涛 左万利 +1 位作者 孙吉贵 车海燕 《计算机研究与发展》 EI CSCD 北大核心 2008年第7期1221-1231,共11页
语义网远景的实现需要自动化的语义标注方法.提出了一种在领域本体指导下,针对中文网页的语义标注方法.运用统计学方法与自然语言处理技术,以文档中句子为处理对象,采取识别和组合两个阶段来完成句子向RDF表示的映射.它具有以下特点:以... 语义网远景的实现需要自动化的语义标注方法.提出了一种在领域本体指导下,针对中文网页的语义标注方法.运用统计学方法与自然语言处理技术,以文档中句子为处理对象,采取识别和组合两个阶段来完成句子向RDF表示的映射.它具有以下特点:以统计方法获得领域相关词汇,构造领域词汇标注列表作为外部领域知识,降低对通用语言本体的依赖;显式的属性类型标注方法识别出句子中表达关系的词汇,标注为属性类型,利于后续关系抽取;构造句子的句法依存关系树(森林),按照依存关系对词汇进行组合,形成RDF陈述.实验结果显示此方法较基于主谓宾语法关系的语义标注方法更为有效. 展开更多
关键词 自然语言处理 依存关系 类型标注 关系抽取 本体
下载PDF
基于弱监督学习的海量网络数据关系抽取 被引量:34
7
作者 陈立玮 冯岩松 赵东岩 《计算机研究与发展》 EI CSCD 北大核心 2013年第9期1825-1835,共11页
在大数据时代,对于海量网络数据的信息抽取与应用已成为自然语言处理和信息检索技术发展的重要主题.其中,基于弱监督的关系抽取方法,因为具有不需要过多人工参与、适应性强的特点,受到了广泛的关注.目前针对它的研究主要集中在英语资源... 在大数据时代,对于海量网络数据的信息抽取与应用已成为自然语言处理和信息检索技术发展的重要主题.其中,基于弱监督的关系抽取方法,因为具有不需要过多人工参与、适应性强的特点,受到了广泛的关注.目前针对它的研究主要集中在英语资源上,主要使用传统的词法和句法特征.然而,词法特征有严重的稀疏性问题,句法特征则对一些语言分析工具的性能有较强的依赖性.提出利用n-gram特征来缓解传统词法特征稀疏性的问题.特别地,这种特征还可以弥补传统句法特征在其他语言上不可靠的情况,对于关系抽取的跨语言应用有重要作用.在此基础上,针对弱监督学习中标注数据不完全可靠的情况,提出基于bootstrapping思想的协同训练方法来对弱监督关系抽取模型进行强化,并且对预测关系时的协同策略进行了详细分析.在大规模的中文和英文数据上进行实验的结果显示,把传统特征与n-gram特征相结合并进行协同训练,在中文和英文数据集上均可以提升弱监督关系抽取的效果,可以适应多语言的关系抽取需求. 展开更多
关键词 关系抽取 弱监督学习 最大熵模型 协同训练 知识库构建
下载PDF
基于多通道自注意力机制的电子病历实体关系抽取 被引量:32
8
作者 宁尚明 滕飞 李天瑞 《计算机学报》 EI CSCD 北大核心 2020年第5期916-929,共14页
电子病历是临床治疗过程中患者病情及治疗流程的重要载体之一,其中各类实体间关系包含了大量与患者健康相关的医学信息.因此,对电子病历文本的深度挖掘是获取医学知识、分析患者病情的有效手段之一.实体的高密度分布以及实体间关系的交... 电子病历是临床治疗过程中患者病情及治疗流程的重要载体之一,其中各类实体间关系包含了大量与患者健康相关的医学信息.因此,对电子病历文本的深度挖掘是获取医学知识、分析患者病情的有效手段之一.实体的高密度分布以及实体间关系的交叉互联为电子病历实体关系的抽取带来了极大挑战,应用于通识领域的实体关系抽取方法也因此受到极大的限制.针对这一文本差异性,本文提出一种基于多通道自注意力机制的"recurrent+transformer"神经网络架构,相比于主流的"recurrent+CNN"架构,该架构可强化模型对句级别语义特征的捕捉,提升对电子病历专有文本特点的学习能力,同时显著降低模型整体复杂度.此外,本文提出在该网络架构下的两种基于权重的辅助训练方法:带权学习的交叉熵损失函数以及基于权重的位置嵌入,前者用于缓解实体关系类别不均衡所造成的训练偏置问题,从而提升模型在真实分布数据中的普适性,同时可加速模型在参数空间的收敛速率;后者则用于进一步放大文本字符位置信息的重要性,以辅助提升transformer网络的训练效果.对比实验选用目前主流方法的6个模型作为基线,相继在2010i2b2/VA及SemEval 2013DDI医学语料中进行验证.相较于传统自注意力机制,多通道自注意力机制的引入在模型整体F1指标中最高实现10.67%的性能提升,在细粒度单项对比实验中,引入类别权重的损失函数在小类别样本中的F1值最高提升近23.55%. 展开更多
关键词 关系抽取 电子病历 多通道自注意力 recurrent+transformer 语义特征
下载PDF
中文观点挖掘中的主观性关系抽取 被引量:24
9
作者 章剑锋 张奇 +1 位作者 吴立德 黄萱菁 《中文信息学报》 CSCD 北大核心 2008年第2期55-59,86,共6页
本文所针对的具体任务是抽取评价词和目标对象之间的关联关系。所采用的方法是将同一句子中共现的评价词与评价对象作为候选集合,应用最大熵模型并结合词、词性、语义和位置等特征进行关系抽取。我们将关系抽取引入观点挖掘,所提出的方... 本文所针对的具体任务是抽取评价词和目标对象之间的关联关系。所采用的方法是将同一句子中共现的评价词与评价对象作为候选集合,应用最大熵模型并结合词、词性、语义和位置等特征进行关系抽取。我们将关系抽取引入观点挖掘,所提出的方法一定程度上解决了指代消解以及评价对象遗漏的问题。实验结果表明该方法的F值比取最近评价对象的Baseline方法有了15%的提高,并且发现程度副词能够帮助提高主观性关系抽取的性能。 展开更多
关键词 计算机应用 中文信息处理 观点挖掘 关系抽取 最大熵
下载PDF
基于神经网络的药物实体与关系联合抽取 被引量:27
10
作者 曹明宇 杨志豪 +2 位作者 罗凌 林鸿飞 王健 《计算机研究与发展》 EI CSCD 北大核心 2019年第7期1432-1440,共9页
药物实体及关系抽取研究对于生物医学研究具有重要的促进作用,也是进一步构建生物医学知识库的基础.现存方法主要采用流水线方式,即先对文本进行实体识别后再对实体对进行关系分类.流水线方法主要存在任务错误传播、未能考虑2个子任务... 药物实体及关系抽取研究对于生物医学研究具有重要的促进作用,也是进一步构建生物医学知识库的基础.现存方法主要采用流水线方式,即先对文本进行实体识别后再对实体对进行关系分类.流水线方法主要存在任务错误传播、未能考虑2个子任务的相互影响和句子中不同关系的相互影响的问题.针对这些问题,提出了一种基于神经网络的药物实体与关系联合抽取方法.使用了一种新标注模式,将药物实体及关系的联合抽取转化为端对端的序列标注任务.使用词向量和字符向量作为词表示输入,使用BiLSTM-CRF模型进行药物实体与关系联合抽取.实验结果表明:在药物药物交互作用(drug-drug interactions, DDI)2013语料集上,取得了89.9%的实体识别 F -score及67.3%的关系抽取 F -score,优于使用相同模型的流水线方法. 展开更多
关键词 联合抽取 标注模式 药物药物交互 关系抽取 实体识别
下载PDF
开放式地理实体关系抽取的Bootstrapping方法 被引量:26
11
作者 余丽 陆锋 刘希亮 《测绘学报》 EI CSCD 北大核心 2016年第5期616-622,共7页
从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过bootstrapping技术统计词语的词性、位置和距离特征来计算语境中词语权值,据此确定描述地理实体关系的关键词... 从网络文本中抽取地理实体间空间关系和语义关系要求高时效性和强鲁棒性。本文提出一种开放式地理实体关系的自动抽取方法,通过bootstrapping技术统计词语的词性、位置和距离特征来计算语境中词语权值,据此确定描述地理实体关系的关键词,最终组织成结构化实例,并使用百度百科和Stanford CoreNLP开展了试验。研究结果表明,本文方法能自动挖掘自然语言的部分词法特征,无须领域专家知识和大规模标注语料,适用于未知关系类型的信息抽取任务;较之经典的Frequency、TFIDF和PPMI频率统计方法,精度和召回率分别提升约5%和23%。 展开更多
关键词 文本挖掘 地理实体 关系抽取 定量评价 BOOTSTRAPPING
下载PDF
基于深度学习的中文实体关系抽取方法 被引量:25
12
作者 孙紫阳 顾君忠 杨静 《计算机工程》 CAS CSCD 北大核心 2018年第9期164-170,共7页
实体关系抽取技术通过文本内容确定句子中实体对之间的关系类别,但由于中文的语法结构复杂、词义理解多样等因素,其对中文实体关系的分类效果不佳。为此,提出一种基于最短依存路径表示文本的深度学习方法。利用依存分析对语句良好的表示... 实体关系抽取技术通过文本内容确定句子中实体对之间的关系类别,但由于中文的语法结构复杂、词义理解多样等因素,其对中文实体关系的分类效果不佳。为此,提出一种基于最短依存路径表示文本的深度学习方法。利用依存分析对语句良好的表示性,配合词性特征,利用长短期记忆(LSTM)网络单元双向结构学习最短依存路径的表示信息,并对LSTM的输出使用卷积神经网络(CNN)训练分类模型。实验结果表明,该方法能够准确地抽取实体关系,其F1值较CNN和Bi-LSTM方法有所提高。 展开更多
关键词 关系抽取 依存分析 最短依存路径 长短期记忆网络 卷积神经网络
下载PDF
面向司法案件的案情知识图谱自动构建 被引量:25
13
作者 洪文兴 胡志强 +3 位作者 翁洋 张恒 王竹 郭志新 《中文信息学报》 CSCD 北大核心 2020年第1期34-44,共11页
以法学知识为中心的认知智能是当前司法人工智能发展的重要方向。该文提出了以自然语言处理(NLP)为核心技术的司法案件案情知识图谱自动构建技术。以预训练模型为基础,对涉及的实体识别和关系抽取这两个NLP基本任务进行了模型研究与设... 以法学知识为中心的认知智能是当前司法人工智能发展的重要方向。该文提出了以自然语言处理(NLP)为核心技术的司法案件案情知识图谱自动构建技术。以预训练模型为基础,对涉及的实体识别和关系抽取这两个NLP基本任务进行了模型研究与设计。针对实体识别任务,对比研究了两种基于预训练的实体识别模型;针对关系抽取任务,该文提出融合平移嵌入的多任务联合的语义关系抽取模型,同时获得了结合上下文的案情知识表示学习。在"机动车交通事故责任纠纷"案由下,和基准模型相比,实体识别的F1值可提升0.36,关系抽取的F1值提升高达2.37。以此为基础,该文设计了司法案件的案情知识图谱自动构建流程,实现了对数十万份判决书案情知识图谱的自动构建,为类案精准推送等司法人工智能应用提供语义支撑。 展开更多
关键词 司法案件 知识图谱 实体识别 关系抽取
下载PDF
基于深度学习的关系抽取研究综述 被引量:24
14
作者 庄传志 靳小龙 +3 位作者 朱伟建 刘静伟 白龙 程学旗 《中文信息学报》 CSCD 北大核心 2019年第12期1-18,共18页
关系抽取(RE)是为了抽取文本中包含的关系,是信息抽取(IE)的重要组成部分。近年来,研究人员利用深度学习技术在该领域开展了深入研究。由于神经网络类型丰富,基于深度学习的关系抽取方法也更加多样。该文从关系抽取的基本概念出发,对关... 关系抽取(RE)是为了抽取文本中包含的关系,是信息抽取(IE)的重要组成部分。近年来,研究人员利用深度学习技术在该领域开展了深入研究。由于神经网络类型丰富,基于深度学习的关系抽取方法也更加多样。该文从关系抽取的基本概念出发,对关系抽取方法依据不同的视角进行了类别划分。随后,介绍了基于深度学习的关系抽取方法常用的数据集,并总结出基于深度学习的关系抽取框架。在此框架下,对关系抽取方法在面向深度学习的输入数据预处理、面向深度学习的神经网络模型设计等方面的具体工作进行了分析与评述,最后对未来的研究方向进行了探讨和展望。 展开更多
关键词 关系抽取 深度学习 远程监督 联合学习
下载PDF
基于维基百科和模式聚类的实体关系抽取方法 被引量:23
15
作者 张苇如 孙乐 韩先培 《中文信息学报》 CSCD 北大核心 2012年第2期75-81,127,共8页
该文提出了一种基于维基百科和模式聚类的方法,旨在从开放文本中抽取高准确率的中文关系实体对。首次使用从人工标注知识体系知网到维基百科实体映射的方式获取关系实例,并且充分利用了维基百科的结构化特性,该方法很好地解决了实体识... 该文提出了一种基于维基百科和模式聚类的方法,旨在从开放文本中抽取高准确率的中文关系实体对。首次使用从人工标注知识体系知网到维基百科实体映射的方式获取关系实例,并且充分利用了维基百科的结构化特性,该方法很好地解决了实体识别的问题,生成了准确而显著的句子实例;进一步,提出了显著性假设和关键词假设,在此基础上构建基于关键词的分类及层次聚类算法,显著提升了模式的可信度。实验结果表明该方法有效提升了句子实例及模式的质量,获得了良好的抽取性能。 展开更多
关键词 关系抽取 维基百科 模式聚类
下载PDF
基于多通道卷积神经网的实体关系抽取 被引量:22
16
作者 肜博辉 付琨 +1 位作者 黄宇 王洋 《计算机应用研究》 CSCD 北大核心 2017年第3期689-692,共4页
针对实体关系抽取任务中,传统基于统计学习的方法构建特征费时费力、现有深度学习方法依赖单一词向量的表征能力的问题,提出多通道卷积神经网模型。使用不同的词向量将输入语句进行映射,作为模型不同通道的输入,然后使用卷积神经网自动... 针对实体关系抽取任务中,传统基于统计学习的方法构建特征费时费力、现有深度学习方法依赖单一词向量的表征能力的问题,提出多通道卷积神经网模型。使用不同的词向量将输入语句进行映射,作为模型不同通道的输入,然后使用卷积神经网自动提取特征,通过softmax分类器输出关系类型,完成关系抽取任务。与其他模型相比,该模型可以获取输入语句更丰富的语义信息,自动学习出更具有区分度的特征。在Sem Eval-2010 Task 8数据集上的实验结果表明提出的多通道卷积神经网模型较使用单一词向量的模型更适合处理关系抽取任务。 展开更多
关键词 关系抽取 卷积神经网 深度学习 多通道
下载PDF
远程监督关系抽取综述 被引量:20
17
作者 杨穗珠 刘艳霞 +2 位作者 张凯文 洪吟 黄翰 《计算机学报》 EI CAS CSCD 北大核心 2021年第8期1636-1660,共25页
远程监督可以为关系抽取任务自动构建数据集,缓解了人工构建数据集的压力和成本,为自动关系抽取的实现奠定基础,然而使用远程监督方法构建的数据集存在错误标注以及长尾问题,严重影响关系抽取性能。目前,远程监督关系抽取任务的主要研... 远程监督可以为关系抽取任务自动构建数据集,缓解了人工构建数据集的压力和成本,为自动关系抽取的实现奠定基础,然而使用远程监督方法构建的数据集存在错误标注以及长尾问题,严重影响关系抽取性能。目前,远程监督关系抽取任务的主要研究方向为关系模型的降噪手段以及对长尾关系的处理方法。近年来,随着深度学习技术的发展,这两个领域的研究工作也迎来了新一轮的机遇与挑战。本文对近几年远程监督关系抽取的研究进展进行综述,针对基于深度学习的远程监督关系抽取任务定义常用工作流,其中包括样本降噪、外部信息融合、编码器和分类器。本文根据不同的模块将已有的研究成果进行分类和梳理,分析比较主要方法,整理其中的关键问题,介绍已有的解决方案和相关数据集,总结远程监督关系抽取任务所用评测指标与评估方式,展望未来研究趋势。 展开更多
关键词 关系抽取 信息抽取 远程监督 降噪 长尾现象 错误标注
下载PDF
基于图的半监督关系抽取 被引量:16
18
作者 陈锦秀 姬东鸿 《软件学报》 EI CSCD 北大核心 2008年第11期2843-2852,共10页
提出利用基于图的半监督学习算法,即标注传递算法,指导计算机从非结构化的文本中自动识别出实体之间的关系.该方法首先利用图策略来建立关系抽取的模型.在这个图模型中,各个有标签和未标签的样本被表示成图上的各个节点,而样本间的距离... 提出利用基于图的半监督学习算法,即标注传递算法,指导计算机从非结构化的文本中自动识别出实体之间的关系.该方法首先利用图策略来建立关系抽取的模型.在这个图模型中,各个有标签和未标签的样本被表示成图上的各个节点,而样本间的距离则作为图上各边的权重.然后,关系抽取的任务就转化成在这个图上估计出一个满足全局一致性假设的标注函数通过对ACE(automatic content extraction)语料库的评测,结果显示,当只有少量的标签样本时,采用该标注传递的方法可以获得比基于SVM(support vector machine)的有监督关系抽取更好的性能,同时也明显优于基于Bootstrapping的半监督关系抽取的方法. 展开更多
关键词 关系抽取 基于图 半监督学习 标签传递
下载PDF
面向维基百科的领域知识演化关系抽取 被引量:19
19
作者 高俊平 张晖 +2 位作者 赵旭剑 杨春明 李波 《计算机学报》 EI CSCD 北大核心 2016年第10期2088-2101,共14页
互联网下同一领域中不同知识概念间存在多种关系,其中演化关系对于用户学习和理解领域知识,梳理领域知识的前序和后续逻辑关系具有重要意义,然而网络数据的多样和无序使用户难以准确有序地获取领域知识关系.针对该问题,提出一种面向中... 互联网下同一领域中不同知识概念间存在多种关系,其中演化关系对于用户学习和理解领域知识,梳理领域知识的前序和后续逻辑关系具有重要意义,然而网络数据的多样和无序使用户难以准确有序地获取领域知识关系.针对该问题,提出一种面向中文维基百科领域知识的演化关系抽取方法,利用语法分析特征,挖掘演化关系模式,构建演化关系推理模型,采用基于句子层面的关系抽取算法识别领域知识演化关系,最后在真实的维基百科数据集上对该文方法进行了性能评测.实验表明,该方法具有较高的关系抽取准确率和召回率,能有效地抽取出维基百科中领域知识的演化关系.同时,基于实验抽取结果构建知识图谱,能有效挖掘领域学科下知识集合的演化体系,识别重难点知识,对学科建设以及相关课程教学具有一定的指导意义. 展开更多
关键词 领域知识 维基百科 演化关系 关系抽取 条件随机场 社会媒体
下载PDF
基于强化学习的知识图谱综述 被引量:18
20
作者 马昂 于艳华 +3 位作者 杨胜利 石川 李劼 蔡修秀 《计算机研究与发展》 EI CSCD 北大核心 2022年第8期1694-1722,共29页
知识图谱是一种用图结构建模事物及事物间联系的数据表示形式,是实现认知智能的重要基础,得到了学术界和工业界的广泛关注.知识图谱的研究内容主要包括知识表示、知识抽取、知识融合、知识推理4部分.目前,知识图谱的研究还存在一些挑战... 知识图谱是一种用图结构建模事物及事物间联系的数据表示形式,是实现认知智能的重要基础,得到了学术界和工业界的广泛关注.知识图谱的研究内容主要包括知识表示、知识抽取、知识融合、知识推理4部分.目前,知识图谱的研究还存在一些挑战.例如,知识抽取面临标注数据获取困难而远程监督训练样本存在噪声问题,知识推理的可解释性和可信赖性有待进一步提升,知识表示方法依赖人工定义的规则或先验知识,知识融合方法未能充分建模实体之间的相互依赖关系等问题.由环境驱动的强化学习算法适用于贯序决策问题.通过将知识图谱的研究问题建模成路径(序列)问题,应用强化学习方法,可解决知识图谱中的存在的上述相关问题,具有重要应用价值.首先梳理了知识图谱和强化学习的基础知识.其次,对基于强化学习的知识图谱相关研究进行全面综述.再次,介绍基于强化学习的知识图谱方法如何应用于智能推荐、对话系统、游戏攻略、生物医药、金融、安全等实际领域.最后,对知识图谱与强化学习相结合的未来发展方向进行展望. 展开更多
关键词 知识图谱 强化学习 命名实体识别 关系抽取 知识推理 知识表示 知识融合
下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部