期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
深度学习实体关系抽取研究综述 被引量:160
1
作者 鄂海红 张文静 +4 位作者 肖思琪 程瑞 胡莺夕 周筱松 牛佩晴 《软件学报》 EI CSCD 北大核心 2019年第6期1793-1818,共26页
实体关系抽取作为信息抽取、自然语言理解、信息检索等领域的核心任务和重要环节,能够从文本中抽取实体对间的语义关系.近年来,深度学习在联合学习、远程监督等方面上的应用,使关系抽取任务取得了较为丰富的研究成果.目前,基于深度学习... 实体关系抽取作为信息抽取、自然语言理解、信息检索等领域的核心任务和重要环节,能够从文本中抽取实体对间的语义关系.近年来,深度学习在联合学习、远程监督等方面上的应用,使关系抽取任务取得了较为丰富的研究成果.目前,基于深度学习的实体关系抽取技术,在特征提取的深度和模型的精确度上已经逐渐超过了传统基于特征和核函数的方法.围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系抽取研究进展,并对未来可能的研究方向进行了探讨和展望. 展开更多
关键词 实体关系抽取 深度学习 联合学习 远程监督 生成对抗网络
下载PDF
水稻病虫草害与药剂实体关系联合抽取算法 被引量:13
2
作者 沈利言 姜海燕 +1 位作者 胡滨 谢元澄 《南京农业大学学报》 CAS CSCD 北大核心 2020年第6期1151-1161,共11页
[目的]从水稻病虫草害防治文本中,自动抽取病虫草害与药剂之间的实体与关系,为构建作物系统领域知识图谱提供数据。[方法]针对病虫草害防治文本中含有大量实体没有明确边界以及药剂与病虫草害实体之间存在多种类型关系的特点,设计了一... [目的]从水稻病虫草害防治文本中,自动抽取病虫草害与药剂之间的实体与关系,为构建作物系统领域知识图谱提供数据。[方法]针对病虫草害防治文本中含有大量实体没有明确边界以及药剂与病虫草害实体之间存在多种类型关系的特点,设计了一种基于新标注模式的双层长短期记忆(bi-directional long short-term memory,BiLSTM)网络与注意力机制结合的水稻病虫草害与药剂的实体关系联合抽取算法(joint entity recognition and relation extraction for rice diseases,pests and weeds,JE-DPW)。该方法在解码层利用BiLSTM网络的前向传播和反向传播,增强对病虫草害防治文本中复杂语义特征的提取;再通过softmax分类器获取字符的类别标签,实现实体识别;与此同时,利用注意力机制判断当前字符与之前字符之间存在的关联关系,实现实体与多关系的联合抽取。[结果]利用包含7380个实体、8605个关系的病虫草害防治文本数据集训练模型,使用测试集测试后发现:JE-DPW算法在病虫草害与药剂的实体抽取和关系分类任务中的准确率分别为91.3%和76.8%,对无边界实体识别的准确率为88.1%。与BiLSTM实现实体抽取方法相比,准确率高出8.1%。与利用循环神经网络(recurrent neural network,RNN)和长短期记忆网络(long short-term memory,LSTM)实现关系分类的方法相比,准确率分别高出22.6%和19.7%;随着关系数量的增加,JE-DPW算法在关系抽取上的F1值可保持17.4%~20.1%的优势。[结论]本文提出的算法可以有效提升水稻病虫草害防治文本中实体关系联合抽取的准确度,提高作物系统领域知识库的构建速度。 展开更多
关键词 病虫草害 实体关系抽取 长短期记忆网络 注意力机制
下载PDF
采用自注意力机制和CNN融合的实体关系抽取 被引量:12
3
作者 闫雄 段跃兴 张泽华 《计算机工程与科学》 CSCD 北大核心 2020年第11期2059-2066,共8页
目前在实体关系抽取任务中,神经网络模型发挥着重要的作用,利用卷积神经网络可以自动提取特征,但是在卷积神经网络中利用固定窗口大小的卷积核来提取句子中词的上下文语义信息受到限制。因此,提出一种新的采用自注意力和卷积神经网络融... 目前在实体关系抽取任务中,神经网络模型发挥着重要的作用,利用卷积神经网络可以自动提取特征,但是在卷积神经网络中利用固定窗口大小的卷积核来提取句子中词的上下文语义信息受到限制。因此,提出一种新的采用自注意力和卷积神经网络融合的关系抽取模型。利用原始的词向量通过自注意力机制计算得到序列中词之间的相互关系,使得输入的词向量表达出更加丰富的语义信息,从而弥补卷积神经网络自动提取特征的不足。在SemEval-2010 Task 8数据集上的实验结果表明,加入自注意力机制以后,本文模型有利于提升实体关系抽取效果。 展开更多
关键词 实体关系抽取 自注意力机制 卷积神经网络 词向量 上下文语义
下载PDF
基于“问题—方法”知识抽取的科研领域知识演化研究:以人工智能为例 被引量:7
4
作者 陈果 彭家彬 肖璐 《情报理论与实践》 CSSCI 北大核心 2022年第6期32-38,共7页
[目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]文章提出了可应用于实践的低成本领域实体关系抽取方... [目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]文章提出了可应用于实践的低成本领域实体关系抽取方案:依托词嵌入类比的思想,仅从领域知识资源中提取的少量实体关系对作为基准即可实现关系分类。[结果/结论]在人工智能领域数据集上使用基于词嵌入类比方案的集成模型,抽取解决关系、问题层级关系、方法层级关系的F1值分别为82.33,81.49,74.81。最后,将集成模型应用于全量数据抽取实体关系,从宏观、中观、微观三个层面展示了面向问题解决的人工智能领域知识演化情况。 展开更多
关键词 实体关系抽取 知识演化 词嵌入类比 领域知识分析 人工智能
原文传递
健康领域Web信息抽取 被引量:6
5
作者 李汝君 张俊 +1 位作者 张晓民 桂小庆 《计算机应用》 CSCD 北大核心 2016年第1期163-170,共8页
针对Web信息抽取(WIE)技术在健康领域应用的问题,提出了一种基于Web Harvest的健康领域Web信息抽取方法。通过对不同健康网站的结构分析设计健康实体的抽取规则,实现了基于Web Harvest的自动抽取健康实体及其属性的算法;再把抽取的实体... 针对Web信息抽取(WIE)技术在健康领域应用的问题,提出了一种基于Web Harvest的健康领域Web信息抽取方法。通过对不同健康网站的结构分析设计健康实体的抽取规则,实现了基于Web Harvest的自动抽取健康实体及其属性的算法;再把抽取的实体及其属性进行一致性检查后存入关系数据库中,然后对关系数据库中隐含健康实体的属性值利用Ansj自然语言处理方法进行实体识别,进而抽取健康实体之间的联系。该技术在健康实体抽取实验中,平均F值达到99.9%,在实体联系抽取实验中,平均F值达到80.51%。实验结果表明提出的Web信息抽取技术在健康领域抽取的健康信息具有较高的质量和可信性。 展开更多
关键词 信息抽取 健康信息抽取 一致性检查 实体识别 实体联系抽取
下载PDF
基于深度字词融合的小麦种质信息实体关系联合抽取
6
作者 刘合兵 贾笑笑 +3 位作者 时雷 熊蜀峰 马新明 席磊 《计算机工程与设计》 北大核心 2024年第4期1079-1086,共8页
为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based ... 为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based on deep character and word fusion)。模型编码层通过深度字词融合和上下文语义特征融合,提高密集实体特征识别能力;模型三元组抽取层建立层叠指针网络,提高重叠关系的提取能力。在小麦种质数据集和公开数据集上的一系列对比实验结果表明,WGIE-DCWF模型能够有效提高小麦种质数据实体关系联合抽取效果,同时拥有较好的泛化性,可以为小麦种质信息知识库构建提供技术支撑。 展开更多
关键词 小麦种质信息 字词融合 实体关系抽取 联合抽取 层叠指针网络 实体识别 关系抽取
下载PDF
融合依存信息的关系导向型实体关系抽取方法 被引量:3
7
作者 王景慧 卢玲 +2 位作者 段志丽 张亮 王玉柯 《计算机应用研究》 CSCD 北大核心 2023年第5期1410-1415,1440,共7页
中文实体关系抽取多以字符序列处理文本,存在字符语义表征不足、长字符序列语义遗忘等问题,制约了远距离实体的召回率,为此提出了一种融合依存句法信息的关系导向型抽取方法。输入层以字符序列和基于同义词表示的词序列为输入;编码端用... 中文实体关系抽取多以字符序列处理文本,存在字符语义表征不足、长字符序列语义遗忘等问题,制约了远距离实体的召回率,为此提出了一种融合依存句法信息的关系导向型抽取方法。输入层以字符序列和基于同义词表示的词序列为输入;编码端用长短时记忆网络(LSTM)进行文本编码,并加入全局依存信息,用于产生关系门的表示;解码端加入依存类型信息,并在关系门的作用下,用双向长短时记忆网络(BiLSTM)解码得到实体关系三元组。该方法在SanWen、FinRE、DuIE、IPRE中文数据集上的F1值分别较基线方法提高5.84%、2.11%、2.69%和0.39%。消融实验表明,提出的全局依存信息和依存类型信息表示方法均可提升抽取性能,对长句和远距离实体的抽取性能也稳定地优于基线方法。 展开更多
关键词 实体关系抽取 依存句法分析 剪枝 关系导向 同义词
下载PDF
基于深度强化学习的文本实体关系抽取方法 被引量:6
8
作者 罗欣 陈艳阳 +2 位作者 耿昊天 许文波 张民 《电子科技大学学报》 EI CAS CSCD 北大核心 2022年第1期91-99,共9页
从文本大数据中快速准确地抽取文本的实体关系信息是构建知识图谱的关键。针对目前主流的远程监督关系抽取方法常常忽略实体对的类型信息和句子语法信息的问题,该文提出了一种基于深度强化学习的文本实体关系抽取方法。首先,利用结合实... 从文本大数据中快速准确地抽取文本的实体关系信息是构建知识图谱的关键。针对目前主流的远程监督关系抽取方法常常忽略实体对的类型信息和句子语法信息的问题,该文提出了一种基于深度强化学习的文本实体关系抽取方法。首先,利用结合实体周围词注意力机制的双向长短期记忆网络作为句子编码的第一个模块;然后,在此基础上加入实体类型嵌入模块,利用实体类型来丰富句子编码信息;最后,将一个依存句法分析模块纳入模型,共同组成了关系抽取器。同时,为实现标签级别的降噪,该文结合强化学习方法,设计了一个标签学习器来学习句子的软标签,以纠正错误标签。设计的标签学习器与关系抽取器结合,构成了基于深度强化学习的文本关系抽取框架。在公开数据集ACE2005、Chinese-Literature-NER-RE-Dataset和自建的数据集上进行实验,结果表明本文提出的方法在精度和召回率上都优于目前几种主流的模型。 展开更多
关键词 深度学习 实体关系抽取 强化学习 远程监督 文本数据
下载PDF
一种面向中医领域科技文献的实体关系抽取方法 被引量:6
9
作者 董美 常志军 《图书情报工作》 CSSCI 北大核心 2022年第18期105-113,共9页
[目的/意义]针对现有的中医领域知识图谱来源于科技文献的知识相对缺少的问题,提出一套面向中医科技文献实体关系抽取的解决方案,补充中医临床研究知识库,为领域知识图谱构建提供数据基础。[方法/过程]针对中医科技文献,设计领域实体关... [目的/意义]针对现有的中医领域知识图谱来源于科技文献的知识相对缺少的问题,提出一套面向中医科技文献实体关系抽取的解决方案,补充中医临床研究知识库,为领域知识图谱构建提供数据基础。[方法/过程]针对中医科技文献,设计领域实体关系表示模型;并根据领域数据多标签和重叠的特点,将实体关系抽取任务分解为关系分类和实体识别两个子任务,将关系分类结果融入实体识别任务中,设计基于预训练模型BERT的实体关系抽取级联模型。[结果/结论]在自建中医科技文献信息抽取数据集(TCM-STD-IE)上进行实验验证,关系分类和实体识别的F1-micro分别为92.74%、93.58%。 展开更多
关键词 实体关系抽取 预训练模型 中医科技文献 领域知识图谱
原文传递
中文电子病历信息提取方法研究综述
10
作者 吉旭瑞 魏德健 +2 位作者 张俊忠 张帅 曹慧 《计算机工程与科学》 CSCD 北大核心 2024年第2期325-337,共13页
电子病历里承载的大量医疗信息能够帮助医生更好地了解患者的情况,辅助医生进行临床诊断。作为中文电子病历信息提取的2大核心任务,命名实体识别和实体关系抽取的目标是识别出电子病历文本中的医学实体并提取出各个实体间的医学关系。首... 电子病历里承载的大量医疗信息能够帮助医生更好地了解患者的情况,辅助医生进行临床诊断。作为中文电子病历信息提取的2大核心任务,命名实体识别和实体关系抽取的目标是识别出电子病历文本中的医学实体并提取出各个实体间的医学关系。首先,系统阐述了中文电子病历的研究现状,指出命名实体识别和实体关系抽取2大任务在中文电子病历信息提取中所发挥的重要作用。随后,介绍了面向中文电子病历信息提取的命名实体识别和关系抽取算法的最新研究成果,并分析了每个阶段各个模型的优缺点。最后,讨论了中文电子病历现阶段所存在的问题并对未来的研究趋势进行展望。 展开更多
关键词 中文电子病历 命名实体识别 实体关系抽取 自然语言处理 深度学习
下载PDF
家禽诊疗文本多实体关系联合抽取模型研究 被引量:6
11
作者 胡滨 汤保虎 +2 位作者 姜海燕 霍傲 韩文笑 《农业机械学报》 EI CAS CSCD 北大核心 2021年第6期268-276,共9页
针对传统实体关系抽取方法中主体特征与句向量难以有效融合、现有BIO标注策略难以有效处理重叠关系的问题,提出一种基于BERT和双重指针标注的家禽疾病诊疗文本实体关系联合抽取模型(Joint extraction of entity relationship of poultry... 针对传统实体关系抽取方法中主体特征与句向量难以有效融合、现有BIO标注策略难以有效处理重叠关系的问题,提出一种基于BERT和双重指针标注的家禽疾病诊疗文本实体关系联合抽取模型(Joint extraction of entity relationship of poultry disease diagnosis and treatment text,JEER_PD)。JEER_PD使用双重指针标注(Dual-pointer labeling,DPL)策略,建立头、尾2个指针标注器,一次性标注出所有实体的开始和结束位置;引入CLN(Conditional layer normalization)网络层,强化主体抽取任务与客体关系联合抽取任务之间的联系;利用概率平衡策略PBS对抗正负类标签类别失衡,以加速模型收敛。实验表明,JEER_PD准确率、召回率和F1分别为97.69%、97.59%和97.64%,3项指标较现有方法均有显著提升,说明JEER_PD能够快速、准确地抽取家禽疾病诊疗复杂知识文本中的实体关系三元组。 展开更多
关键词 家禽疾病诊疗文本 实体关系抽取 关系重叠 BERT语言模型 双重指针标注
下载PDF
基于卷积神经网络的医疗护理实体关系抽取
12
作者 曹茂俊 胡喆 《电子设计工程》 2024年第8期18-22,共5页
针对医疗护理领域知识复杂性强、数据量大以及对准确度要求较高的问题,该研究提出一种基于卷积神经网络的医疗护理学实体关系抽取方法,实现对护理学语义关系的细粒度文本挖掘。该研究构建了医疗护理学语料标注系统,通过将医疗语料转化... 针对医疗护理领域知识复杂性强、数据量大以及对准确度要求较高的问题,该研究提出一种基于卷积神经网络的医疗护理学实体关系抽取方法,实现对护理学语义关系的细粒度文本挖掘。该研究构建了医疗护理学语料标注系统,通过将医疗语料转化为向量特征矩阵,实现了对医疗语料的自动过滤和标注。通过向神经网络模型嵌入所构建的医疗关系语料库,一定程度上提高了模型疾病分类的准确度。在医疗护理学数据集上的实验表明,基于卷积神经网络的模型在指标精确度、召回率、F1值可达到89.78%、87.59%、89.77%。综上所述,该研究提出的基于卷积神经网络的医疗护理学实体关系抽取方法能够有效地抽取医疗语料数据中的实体关系,优于传统的实体关系抽取模型。 展开更多
关键词 实体关系抽取 卷积神经网络 医疗护理学 词向量 知识图谱
下载PDF
中文医学文献的实体关系提取研究及在糖尿病医学文献中的应用 被引量:6
13
作者 范智渊 何璇 +2 位作者 梁品 吕晶 康雁 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2021年第3期563-573,共11页
医学文献含有丰富的有价值的医学知识。目前,在医学文献上的实体关系提取研究已经得到了很大的进步,但是随着医学文献数量以指数形式增加,医学文本的标注工作成为一个很大的问题。为解决人工标注耗时长、工作量大的问题,研究者提出了远... 医学文献含有丰富的有价值的医学知识。目前,在医学文献上的实体关系提取研究已经得到了很大的进步,但是随着医学文献数量以指数形式增加,医学文本的标注工作成为一个很大的问题。为解决人工标注耗时长、工作量大的问题,研究者提出了远程监督标注的方法,但这种方法会引入大量噪声。本文提出了一种基于卷积神经网络的新型神经网络结构,可以解决大量噪声问题。该模型可以利用多窗口卷积神经网络自动提取句子特征,在得到句子向量后,通过注意力机制选择对真实关系有效的句子。特别地,提出实体类型(ET)嵌入方法,通过加入实体类型特征用于关系分类。我们针对训练文本存在不可避免的标注错误问题,提出句子级别的注意力机制用于关系提取。使用968份糖尿病医学文献进行实验,结果表明,与基线模型相比,本文模型在医学文献中得到了较好的效果,F1分数达到93.15%。最后,我们将提取的11类关系以三元组的形式存储,并利用这些三元组制成具有33347个节点、43686条关系边的复杂关系医学知识图谱。实验结果证明,本文所使用的算法明显优于用于关系提取的最佳基准系统。 展开更多
关键词 医学文献 实体关系提取 卷积神经网络 知识图谱 糖尿病
原文传递
最近对寻址的专利实体关系抽取方法
14
作者 李成奇 雷海卫 +1 位作者 李帆 呼文秀 《计算机工程与设计》 北大核心 2024年第4期1100-1108,共9页
针对专利领域没有公开数据集的问题,标注一个中文专利实体关系抽取数据集PERD(patent entity relation dataset)。为完成实体关系抽取任务,提出最近对寻址的实体关系抽取模型NPAM(nearest pair addressing entity relationship extracti... 针对专利领域没有公开数据集的问题,标注一个中文专利实体关系抽取数据集PERD(patent entity relation dataset)。为完成实体关系抽取任务,提出最近对寻址的实体关系抽取模型NPAM(nearest pair addressing entity relationship extraction model),实体位置信息获取方法的改进、注意力机制建模矩阵和实体抽取方法的创新,使该模型在PERD上F1值达到72.74%,相比模型PRGC提升12.64个百分点。实验结果验证了该模型的有效性。 展开更多
关键词 实体关系抽取 专利领域 数据集 最近对寻址 注意力机制 关联性矩阵 全词标记
下载PDF
基于知识图谱的多数据集成抽取方法仿真 被引量:1
15
作者 何芳州 王祉淇 《计算机仿真》 北大核心 2023年第12期422-427,共6页
在传统多数据知识的三元组实体关系抽取任务中,存在实体识别精度低下,实体关系抽取复杂度高、重叠率大、缺失数据多等问题。构建了一种基于双层注意力机制增强双特征的神经网络模型—BIO-VEC-DAM模型,提高了实体识别率,降低了实体关系... 在传统多数据知识的三元组实体关系抽取任务中,存在实体识别精度低下,实体关系抽取复杂度高、重叠率大、缺失数据多等问题。构建了一种基于双层注意力机制增强双特征的神经网络模型—BIO-VEC-DAM模型,提高了实体识别率,降低了实体关系抽取的复杂性与重叠率。BIO-VEC-DAM模型首先通过BIO标注法对多数据进行集成处理,减低数据冗杂,构建三元组的初始形态;然后利用改进BIO标注法提取三元组的位置特征,并采用WORD2Vec算法提取三元组的置信度特征;接着使用双层注意力机制增强位置特征与置信度特征,提高特征辨识度;最后将增强后的特征投入到神经网络模型中进行训练。实体关系抽取实验的仿真结果表明,BIO-VEC-DAM模型较传统模型与单一特征增强的CNN模型相比,准确率与召回率均有显著提升;且在实体识别任务中,经不同数据集的训练后,上述模型较其它模型相比,F1值平均提高了0.96%。所以,在三元组实体关系抽取任务中,构建的BIO-VEC-DAM模型性能更为优越。 展开更多
关键词 数据集成 实体关系抽取 实体识别
下载PDF
融合多源数据的学科知识图谱构建与应用 被引量:1
16
作者 孙锡波 谢晓尧 郑欣 《福建电脑》 2023年第11期6-13,共8页
学科知识图谱可以给学生及教育工作者提供一个清晰、结构化的学科知识体系。本文提出一种融合多源数据的智能学科知识图谱构建方法,并在中学化学学科实现。首先进行本体设计,并依据本体设计完成了基于BERT模型的命名实体识别和基于特征... 学科知识图谱可以给学生及教育工作者提供一个清晰、结构化的学科知识体系。本文提出一种融合多源数据的智能学科知识图谱构建方法,并在中学化学学科实现。首先进行本体设计,并依据本体设计完成了基于BERT模型的命名实体识别和基于特征提取的实体关系抽取,之后对多种数据源进行融合,最终将数据存储于Neo4j图数据库中实现可视化应用。该知识图谱有助于为中学学科智能辅助学习系统的搭建提供支撑,起到支持学生个性化学习的重要作用。 展开更多
关键词 化学学科 实体关系抽取 知识图谱 图数据库
下载PDF
土壤肥力与农作物科学施肥管理融合知识图谱构建与可视化 被引量:1
17
作者 张彩丽 吴赛赛 +2 位作者 李玮 王慧 陈磊 《农学学报》 2023年第7期80-86,共7页
为促进人工智能各项技术在农业生产中发挥作用,探索土壤肥力领域知识的组织、应用,采用人工构建的方法,以安徽省为例,使用Protégé本体库构建工具构建土壤肥力领域本体,再将土壤肥力相关的结构化、半结构化和非结构化数据通过... 为促进人工智能各项技术在农业生产中发挥作用,探索土壤肥力领域知识的组织、应用,采用人工构建的方法,以安徽省为例,使用Protégé本体库构建工具构建土壤肥力领域本体,再将土壤肥力相关的结构化、半结构化和非结构化数据通过纠错等操作后采取反距离加权插值,基于ERNIE-BiLSTMCRF与PCNN-Attention深度学习模型实现命名实体识别和关系抽取任务,其后把得到的三元组数据保存至图数据库Neo4j中,成功构建土壤肥力可视化知识图谱。该研究可在本体构建、实体关系抽取模型以及知识图谱的可视化方面为其他农业知识图谱的构建提供参考。 展开更多
关键词 土壤肥力 本体构建 实体关系抽取 深度学习 知识图谱
下载PDF
基于改进词向量GRU神经网络模型的藏语实体关系抽取 被引量:5
18
作者 孙媛 王丽客 郭莉莉 《中文信息学报》 CSCD 北大核心 2019年第6期35-41,共7页
互联网数据的爆炸式增长,使得研究热点更多转向Web内容结构化分析。如果将藏语知识以结构化形式表示,那么将会有利于藏语知识的结构化分析和深度挖掘。该文提出了一种优化词向量的GRU神经网络模型进行藏语实体关系抽取的方法。在模型的... 互联网数据的爆炸式增长,使得研究热点更多转向Web内容结构化分析。如果将藏语知识以结构化形式表示,那么将会有利于藏语知识的结构化分析和深度挖掘。该文提出了一种优化词向量的GRU神经网络模型进行藏语实体关系抽取的方法。在模型的训练中,加入了优化的词向量,在传统的词向量模型中结合藏语音节向量、音节位置向量、词性向量等特征对词向量进一步优化,并且选取了藏语词汇特征和藏语句子特征。实验证明,通过使用改进词向量F1值达到了78.43%。 展开更多
关键词 实体关系抽取 词向量 GRU神经网络
下载PDF
基于BERT的非招标采购实体关系抽取研究
19
作者 张朝阳 《信息通信技术与政策》 2023年第6期2-9,共8页
提出了一种基于BERT的实体长度感知的实体关系抽取模型IL-BERT,该模型在经过BERT方法提取的实体特征向量上引入实体长度信息,以增强实体特征的表示能力。分别在公共数据集和非招标采购领域数据集上进行试验,结果表明,提出模型的数值均... 提出了一种基于BERT的实体长度感知的实体关系抽取模型IL-BERT,该模型在经过BERT方法提取的实体特征向量上引入实体长度信息,以增强实体特征的表示能力。分别在公共数据集和非招标采购领域数据集上进行试验,结果表明,提出模型的数值均优于基线模型。 展开更多
关键词 BERT 实体关系抽取 实体长度感知 非招标采购
下载PDF
基于MFE-BERT与FNNAttention的心理医学知识图谱构建
20
作者 刘子轩 申艳光 +1 位作者 李焰 苏文婷 《计算机系统应用》 2023年第11期108-119,共12页
针对心理医学领域文本段落冗长、数据稀疏、知识散乱且规范性差的问题,提出一种基于多层级特征抽取能力预训练模型(MFE-BERT)与前向神经网络注意力机制(FNNAttention)的心理医学知识图谱构建方法.MFE-BERT在BERT模型基础上将其内部所有E... 针对心理医学领域文本段落冗长、数据稀疏、知识散乱且规范性差的问题,提出一种基于多层级特征抽取能力预训练模型(MFE-BERT)与前向神经网络注意力机制(FNNAttention)的心理医学知识图谱构建方法.MFE-BERT在BERT模型基础上将其内部所有Encoder层特征进行合并输出,以获取包含更多语义的特征向量,同时对两复合模型采用FNNAttention机制强化词级关系,解决长文本段落语义稀释问题.在自建的心理医学数据集中,设计MFE-BERT-BiLSTM-FNNAttention-CRF和MFE-BERT-CNN-FNNAttention复合神经网络模型分别进行心理医学实体识别和实体关系抽取,实体识别F1值达到93.91%,实体关系抽精确率达到了89.29%,通过融合文本相似度与语义相似度方法进行实体对齐,将所整理的数据存储在Neo4j图数据库中,构建出一个含有3652个实体,2396条关系的心理医学知识图谱.实验结果表明,在MFE-BERT模型与FNNAttention机制的基础上构建心理医学知识图谱切实可行,提出的改进模型所搭建的心理医学知识图谱可以更好地应用于心理医学信息管理中,为心理医学数据分析提供参考. 展开更多
关键词 知识图谱 心理医学 命名实体识别 实体关系抽取 MFE-BERT模型 FNNAttention机制
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部