期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
针刺临床文献自然语言处理中术语的智能化标注和抽取方法 被引量:6
1
作者 刘华云 韩晨静 +3 位作者 熊婕 李海燕 雷蕾 刘保延 《中国针灸》 CAS CSCD 北大核心 2022年第3期327-331,共5页
分析针刺临床文献术语识别任务的特殊性,对比目前应用于中医药领域的3种命名实体识别(NER方法的优缺点,认为双向长短期记忆神经网络-条件随机场模型(Bi LSTM-CRF)能结合上下文信息,利用较少的特征规律完成NER,适合针刺临床文献的术语识... 分析针刺临床文献术语识别任务的特殊性,对比目前应用于中医药领域的3种命名实体识别(NER方法的优缺点,认为双向长短期记忆神经网络-条件随机场模型(Bi LSTM-CRF)能结合上下文信息,利用较少的特征规律完成NER,适合针刺临床文献的术语识别。在此模型基础上,提出针刺临床文献术语识别流程主要包括文献预处理、序列标注、模型训练及效果评价4个方面,为针刺临床文献术语结构化提供思路。 展开更多
关键词 针刺临床文献 术语识别 命名实体识别 双向长短期记忆神经网络-条件随机场模型
原文传递
基于事件抽取的学科建设知识图谱构建与应用 被引量:2
2
作者 李家瑞 李华昱 +1 位作者 闫阳 付亚凤 《计算机系统应用》 2022年第11期100-110,共11页
学科建设是高校发展的核心,随着高校学科建设的不断深入与强化,学科建设信息持续增加,且以离散的文件组织形式难以对学科建设成果进行高效的管理,不利于后续分析与评估工作的开展.针对此问题,对学科建设知识图谱的构建及相关应用进行了... 学科建设是高校发展的核心,随着高校学科建设的不断深入与强化,学科建设信息持续增加,且以离散的文件组织形式难以对学科建设成果进行高效的管理,不利于后续分析与评估工作的开展.针对此问题,对学科建设知识图谱的构建及相关应用进行了研究.首先通过BERT-BiLSTM-CRF模型对学科建设文本进行事件抽取,并使用爬虫进行相关知识的补充.然后选择属性图模型存储知识,完成学科建设知识图谱的初步构建.基于构建好的知识图谱,搭建了学科建设可视化系统,并引入最小斯坦纳树算法实现智能问答应用.最后,通过对学科建设事件抽取与智能问答方法进行实验分析,验证了本文所提出方法的有效性. 展开更多
关键词 知识图谱 学科建设 BERT-bilstm-crf 斯坦纳树 智能问答 事件抽取
下载PDF
理论术语抽取的深度学习模型及自训练算法研究 被引量:39
3
作者 赵洪 王芳 《情报学报》 CSSCI CSCD 北大核心 2018年第9期923-938,共16页
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的... 理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。 展开更多
关键词 理论术语抽取 深度学习 循环神经网络 bi-lstm-crf 自训练
下载PDF
基于BI-LSTM-CRF模型的中文分词法 被引量:21
4
作者 张子睿 刘云清 《长春理工大学学报(自然科学版)》 2017年第4期87-92,共6页
递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CR... 递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CRF层考虑输出标签之间前后的依赖关系。利用该分词模型,通过加入预训练的字嵌入向量,以及使用不同词位标注集在Bakeoff2005数据集上进行的分词实验,结果表明:BI-LSTM-CRF模型比LSTM和双向LSTM模型具有更好的分词性能,同时具有很好地泛化能力;相比四词位,采用六词位标注集的神经网络模型能够取得更好的分词性能。 展开更多
关键词 中文分词 bi-lstm-crf 词位标注
下载PDF
基于Bi-LSTM-CRF的商业领域命名实体识别 被引量:17
5
作者 丁晟春 方振 王楠 《现代情报》 CSSCI 2020年第3期103-110,共8页
[目的/意义]为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程]该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[... [目的/意义]为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程]该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[结果/结论]实验结果显示对企业全称实体、企业简称实体与人名实体3类命名实体识别的识别率平均F值为90.85%,验证了所提方法的有效性,证明了本研究有效地改善了商业领域中的命名实体识别效率。 展开更多
关键词 商业领域 命名实体识别 深度学习 bi-lstm-crf
下载PDF
基于深度学习的数据科学招聘实体自动抽取及分析研究 被引量:15
6
作者 王东波 胡昊天 +1 位作者 周鑫 朱丹浩 《图书情报工作》 CSSCI 北大核心 2018年第13期64-73,共10页
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大... [目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi—LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。 展开更多
关键词 数据科学 条件随机场 深度学习 bi-lstm-crf
原文传递
面向国防科技领域的技术和术语识别方法研究 被引量:12
7
作者 冯鸾鸾 李军辉 +1 位作者 李培峰 朱巧明 《计算机科学》 CSCD 北大核心 2019年第12期231-236,共6页
随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础。文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi... 随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础。文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi-LSTM+CRF模型上的应用。此外,针对任务的特点,提出了适用于技术和术语识别的语言学特征。基于该领域的语料库,实验结果表明技术和术语识别的F1值达到了71.80%,较基准系统提升了3.04%,能够较好地识别出面向国防科技领域的技术和术语。同时,所提方法也优于基于BERT模型的技术术语识别方法。 展开更多
关键词 面向国防科技领域 技术和术语 子词 bi-lstm+crf模型 语言学特征
下载PDF
新时代人民日报分词语料库构建、性能及应用(二)——深度学习自动分词模型构建 被引量:9
8
作者 黄水清 王东波 《图书情报工作》 CSSCI 北大核心 2019年第23期5-12,共8页
[目的/意义]在新时代人民日报分词语料库的基础上构建的深度学习自动分词模型,不仅有助于为高性能分词模型的构建提供经验,也可以借助具体的自然语言处理研究任务验证深度学习相应模型的性能。[方法/过程]在介绍双向长短时记忆模型(Bi-L... [目的/意义]在新时代人民日报分词语料库的基础上构建的深度学习自动分词模型,不仅有助于为高性能分词模型的构建提供经验,也可以借助具体的自然语言处理研究任务验证深度学习相应模型的性能。[方法/过程]在介绍双向长短时记忆模型(Bi-LSTM)和双向长短时记忆与条件随机场融合模型(Bi-LSTM-CRF)的基础上,阐明汉语分词语料预处理、评价指标和参数与硬件平台的过程、种类和情况,分别构建Bi-LSTM和Bi-LSTM-CRF汉语自动分词模型,并对模型的整体性能进行分析。[结果/结论]从精准率、召回率和调和平均值3个指标上看,所构建的Bi-LSTM和Bi-LSTM-CRF汉语自动分词模型的整体性能相对较为合理。在具体性能上,Bi-LSTM分词模型优于Bi-LSTM-CRF分词模型,但这一差距非常细微。 展开更多
关键词 新时代人民日报分词语料 语料库 自动分词 深度学习 bi-lstm bi-lstm-crf
原文传递
采用BI-LSTM-CRF模型的数值信息抽取 被引量:10
9
作者 王竣平 白宇 蔡东风 《计算机应用与软件》 北大核心 2019年第5期138-144,共7页
数值信息是文本中的一种重要信息,含有主体、属性、属性值等元素。然而当前数值信息抽取方法对比较关系的表示比较单一,对于含有多个数值的句子,其数值信息抽取的效果不佳。根据文本中数量关系表述特征,提出一种数值信息表示方法和数值... 数值信息是文本中的一种重要信息,含有主体、属性、属性值等元素。然而当前数值信息抽取方法对比较关系的表示比较单一,对于含有多个数值的句子,其数值信息抽取的效果不佳。根据文本中数量关系表述特征,提出一种数值信息表示方法和数值信息抽取框架。根据数值信息中各个元素的特点,利用BI-LSTM-CRF模型对数值信息元素进行识别;利用语言特征判断属性值和其他元素之间的语义关系。该方法对数值信息抽取的准确率、召回率和F值分别达到0.775、0.752和0.763,优于现有的抽取的方法。 展开更多
关键词 数值信息表示 语义关系 bi-lstm-crf模型
下载PDF
基于BERT-Bi-LSTM-CRF模型的自主式交通系统参与主体识别方法 被引量:8
10
作者 唐进君 庹昊南 +1 位作者 刘佑 付强 《交通信息与安全》 CSCD 北大核心 2022年第5期80-90,共11页
自主式交通系统(ATS)的重要组成部分是参与主体,参与主体的信息通常依靠文本进行描述。为构建自主式交通知识图谱,需要从文本中准确地识别出大量参与主体。为此,研究了基于BERT-Bi-LSTM-CRF模型的实体识别方法,对自主式交通系统参与主... 自主式交通系统(ATS)的重要组成部分是参与主体,参与主体的信息通常依靠文本进行描述。为构建自主式交通知识图谱,需要从文本中准确地识别出大量参与主体。为此,研究了基于BERT-Bi-LSTM-CRF模型的实体识别方法,对自主式交通系统参与主体进行抽取。词嵌入模型BERT为预训练语言模型,用以捕获丰富的语义特征,将捕获的语义特征输入到双向长短时记忆神经网络(Bi-LSTM)模型中提取上下文双向序列信息,经条件随机场(CRF)处理得到最优序列预测结果。收集交通专业相关的原始语料,经过数据预处理与文本标注,形成了可用于自主式交通系统参与主体识别的语料库,基于此数据开展实体识别对比实验。结果证明:BERT模型显著提升了自主式交通系统参与主体识别任务的性能。相较于传统方法 CNN-LSTM或Bi-LSTM等,所提方法可以得到最佳综合识别效果,各实体的综合F1值为86.81%,表明通过BERT模型提取参与主体的语义特征,可以增强识别方法的泛化能力。“使用者”“运营者”“提供者”“规划者”“维护者”类实体的F1值分别为90.35%,92.31%,90.48%,93.33%,95.00%。验证了所提方法识别自主式交通系统参与主体的有效性。 展开更多
关键词 智能交通 命名实体识别 知识图谱 BERT-bi-lstm-crf 知识建模
下载PDF
基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究 被引量:8
11
作者 马建霞 袁慧 蒋翔 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第2期78-88,共11页
【目的】从文本中抽取脆弱生态治理技术、实施地、实施时间等命名实体,并分析相关态势。【方法】利用Bi-LSTM+CRF结合基于特征的命名实体知识库对脆弱生态治理领域CNKI数据库中的相关文献进行脆弱生态治理技术、地名实体、时间实体的自... 【目的】从文本中抽取脆弱生态治理技术、实施地、实施时间等命名实体,并分析相关态势。【方法】利用Bi-LSTM+CRF结合基于特征的命名实体知识库对脆弱生态治理领域CNKI数据库中的相关文献进行脆弱生态治理技术、地名实体、时间实体的自动抽取和标记。【结果】对于中文文献中生态治理技术相关实体的抽取,获得P值74.34%、R值64.04%和F1值68.81%。采用Bi-LSTM+CRF神经网络模型与单纯采用CRF相比,P值提高9.41%,F1值提高4.26%,R值基本持平。【局限】依赖于中文分词工具的准确性;仅对相关的实体进行抽取,尚未抽取实体之间的关系。【结论】Bi-LSTM+CRF结合基于特征的命名实体知识库抽取命名实体技术,可用于基于细粒度内容的资源环境情报分析。 展开更多
关键词 bi-lstm+crf 文本挖掘 生态治理技术 命名实体识别
原文传递
基于NER 的石油非结构化信息抽取研究 被引量:7
12
作者 钟原 刘小溶 +2 位作者 王杰 陈雁 张泰 《西南石油大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第6期165-173,共9页
随着“智能油田”的建设加快,构建基于海量石油数据的智能分析系统意义重大。然而,由于石油生产过程中产生的文本数据往往无结构且类型多样,从中抽取关键信息进行分析成为一个研究热点,而信息抽取又需要高质量的语义实体做支撑。根据这... 随着“智能油田”的建设加快,构建基于海量石油数据的智能分析系统意义重大。然而,由于石油生产过程中产生的文本数据往往无结构且类型多样,从中抽取关键信息进行分析成为一个研究热点,而信息抽取又需要高质量的语义实体做支撑。根据这一特定问题,提出基于命名实体识别(Named Entity Recognition,NER)技术针对石油非结构化文本进行信息抽取,构建双向长短时记忆(Bidirectional Long Short-Term Memory,Bi LSTM)网络模型提取语料特征,并结合条件随机场(Conditional Random Field,CRF)做分类器,构建了基于Bi LSTM+CRF的高精度NER模型,针对石油工业领域的非结构化文本进行命名实体抽取。通过在修井作业文本数据集上进行对比实验表明,本方法具有较高的精确率和召回率。 展开更多
关键词 命名实体识别 bi lstm+crf 信息抽取 非结构化文本
下载PDF
基于双层Bi-LSTM-CRF模型的糖尿病领域命名实体识别 被引量:6
13
作者 何春辉 王梦贤 何小波 《邵阳学院学报(自然科学版)》 2020年第1期21-26,共6页
随着信息技术的发展,电子文档在糖尿病领域的信息记录中得到了大量应用,通过自动化技术对这些电子文档进行分析具有重大的意义。由于现有的命名实体识别方法在糖尿病领域中识别准确率偏低。为了改变这种现状,提出了双层的双向长短时记... 随着信息技术的发展,电子文档在糖尿病领域的信息记录中得到了大量应用,通过自动化技术对这些电子文档进行分析具有重大的意义。由于现有的命名实体识别方法在糖尿病领域中识别准确率偏低。为了改变这种现状,提出了双层的双向长短时记忆神经网络条件随机场模型(Bi-LSTM-CRF),并将其应用到糖尿病领域命名实体识别任务中。实验结果表明该模型在包含15种实体类别的数据集上准确率达到了89.14%,且在外部测试集上平均F 1值为72.89%,充分揭示了双层Bi-LSTM-CRF模型的有效性。 展开更多
关键词 糖尿病 命名实体识别 字符嵌入 bi-lstm-crf
下载PDF
基于Bi-LSTM-CRF模型的维吾尔语词干提取的研究 被引量:6
14
作者 古丽尼格尔·阿不都外力 吐尔根·依布拉音 +1 位作者 卡哈尔江·阿比的热西提 王路路 《中文信息学报》 CSCD 北大核心 2019年第8期60-66,共7页
词干提取是维吾尔语自然语言处理中的基础性研究,其提取质量直接影响其他任务的性能。但目前维吾尔语词干提取研究存在过度切分、不切分和歧义切分等问题,这些问题导致词干提取质量不高,对后续任务的性能影响较大。因此该文提出了基于Bi... 词干提取是维吾尔语自然语言处理中的基础性研究,其提取质量直接影响其他任务的性能。但目前维吾尔语词干提取研究存在过度切分、不切分和歧义切分等问题,这些问题导致词干提取质量不高,对后续任务的性能影响较大。因此该文提出了基于Bi-LSTM-CRF的维吾尔语词干提取模型,将字符作为最小切分单位,选取维吾尔语字符特征、音类特征以及语音特征为候选特征,结合模型进行实验。实验表明,该文提出的Bi-LSTM-CRF模型在维吾尔语词干提取任务上,F1值达到了88%,在融入手工提取的候选特征之后,F1值提高了1.8个点,有效提高了词干提取的准确性,缓解了上述问题带来的影响。 展开更多
关键词 维吾尔语 词干提取 bi-lstm-crf
下载PDF
融合全局语义信息的BIG-LSTM-CRF模型
15
作者 胡俊英 王煜华 +1 位作者 金书意 张博 《纯粹数学与应用数学》 2024年第1期106-116,共11页
命名实体识别任务是针对输入的文本句子做序列标注的一类自然语言处理任务,其目的是抽取出文本句子中的主语实体和宾语实体.基于深度神经网络的提取方法获得了优异的性能,其中BI-LSTM-CRF是效果显著且具有代表性的模型之一.但该模型在... 命名实体识别任务是针对输入的文本句子做序列标注的一类自然语言处理任务,其目的是抽取出文本句子中的主语实体和宾语实体.基于深度神经网络的提取方法获得了优异的性能,其中BI-LSTM-CRF是效果显著且具有代表性的模型之一.但该模型在训练过程中忽略了全局语义信息对实体识别准确度的影响.本文通过引入全局语义信息来改进BI-LSTM-CRF模型用于命名实体识别任务的性能:先通过添加一层带有激活操作的全连接层来提取输入文本句子的高维语义信息;再通过一个全连接层将高维语义信息与每个字符进行深度融合,得到该句子融合了全局语义信息的向量表示,并将其用于后续的命名实体识别任务.通过将改进后的模型用于CLUENER2020数据集上,验证了添加全局语义信息融合模块可以提升模型命名实体识别的准确度. 展开更多
关键词 bi-lstm-crf 自然语言处理 命名实体识别 神经网络
下载PDF
基于异构数据联合训练的中文分词法 被引量:6
16
作者 姜猛 王子牛 高建瓴 《电子科技》 2019年第4期29-32,59,共5页
中文分词技术作为中文信息处理中的关键基础技术之一,基于深度学习模型的中文分词法受到广泛关注。然而,深度学习模型需要大规模数据训练才能获得良好的性能,而当前中文分词语料数据相对缺乏且标准不一。文中提出了一种简单有效的异构... 中文分词技术作为中文信息处理中的关键基础技术之一,基于深度学习模型的中文分词法受到广泛关注。然而,深度学习模型需要大规模数据训练才能获得良好的性能,而当前中文分词语料数据相对缺乏且标准不一。文中提出了一种简单有效的异构数据处理方法,对不同语料数据加上两个人工设定的标识符,使用处理过的数据应用于双向长短期记忆网络结合条件随机场(Bi-LSTM-CRF)的中文分词模型的联合训练。实验结果表明,基于异构数据联合训练的Bi-LSTM-CRF模型比单一数据训练的模型具有更好的分词性能。 展开更多
关键词 中文分词 深度学习 bi-lstm-crf 异构数据 联合训练 语料库
下载PDF
储气库站场天然气泄漏及火灾事故应急知识图谱构建
17
作者 宋旭 文明 +1 位作者 胡瑾秋 龚建华 《消防科学与技术》 CAS 北大核心 2024年第6期826-831,共6页
针对消防、应急处置过程中快速进行决策支持和方案制定的难点,提出储气库站场天然气泄漏及火灾事故的应急模型,该模型应用知识图谱作为风险表征手段,利用双向编码表示转换器(BERT)和双向长短时记忆模型条件随机场算法(BiLSTM-CRF),实现... 针对消防、应急处置过程中快速进行决策支持和方案制定的难点,提出储气库站场天然气泄漏及火灾事故的应急模型,该模型应用知识图谱作为风险表征手段,利用双向编码表示转换器(BERT)和双向长短时记忆模型条件随机场算法(BiLSTM-CRF),实现对文本信息的实体识别和关系抽取。利用Neo4j图数据库构建储气库站场天然气泄漏及火灾事故的应急知识图谱。结果表明:相较于传统的应急处置、消防策略研究方法,本文提出的储气库站场天然气泄漏及火灾事故应急模型不仅可以实现对储气库站场天然气泄漏及火灾事故的早期应急处置,还能够识别事故的风险传播路径,为消防应急指挥和应急决策提供支持。 展开更多
关键词 消防救援 应急决策 知识图谱 天然气泄漏 BERT-bi-lstm-crf
下载PDF
基于多任务的中文电子病历中命名实体识别研究 被引量:5
18
作者 杨晓辉 毕雪华 +1 位作者 张琳琳 高颖 《东北师大学报(自然科学版)》 CAS 北大核心 2020年第1期81-87,共7页
针对电子病历结构化中的命名实体识别问题,提出一种基于分词任务和命名实体识别任务相结合的多任务双向长短期记忆网络模型(Bidirectional Long Short-Term Memory Conditional Random Feld,Bi-LSTM-CRF).该模型通过加入共享LSTM捕获分... 针对电子病历结构化中的命名实体识别问题,提出一种基于分词任务和命名实体识别任务相结合的多任务双向长短期记忆网络模型(Bidirectional Long Short-Term Memory Conditional Random Feld,Bi-LSTM-CRF).该模型通过加入共享LSTM捕获分词任务中的词边界信息,丰富了命名实体识别任务的特征集,进而达到提高命名实体的效果.实验采集数据由新疆某三甲医院提供的500份冠心病患者的出院小结和2000份心血管疾病患者的出院小结组成.实验结果表明:F-measure值达到了0.927,满足临床的实际需求. 展开更多
关键词 电子病历 命名实体识别 多任务 bi-lstm-crf
下载PDF
基于CRF和Bi-LSTM的保险名称实体识别 被引量:5
19
作者 陈彦妤 杜明 《智能计算机与应用》 2018年第3期111-114,共4页
在保险领域智能问答应用研究中,用户提问时大量使用缩写、简写的保险名称,降低了问题语义理解的准确率。为解决这个问题,本文提出使用条件随机场(CRF)与双向长短记忆循环神经网络相结合的模型(Bi-LSTM-CRF),加入预先训练好的字嵌入向量... 在保险领域智能问答应用研究中,用户提问时大量使用缩写、简写的保险名称,降低了问题语义理解的准确率。为解决这个问题,本文提出使用条件随机场(CRF)与双向长短记忆循环神经网络相结合的模型(Bi-LSTM-CRF),加入预先训练好的字嵌入向量进行训练的方法来识别保险名称。实验结果表明,CRF结合双向的LSTM的方法相较于传统机器学习的方法,在保险领域命名实体的识别中具有更好的性能,显著提高了保险名称识别的准确率和召回率。 展开更多
关键词 bi-lstm-crf 命名识别识别 保险智能问答
下载PDF
基于多维特征分析的戏曲类方志文献命名实体识别研究
20
作者 翟姗姗 余华娟 +1 位作者 陈健瑶 夏立新 《情报学报》 CSCD 北大核心 2024年第9期1094-1104,共11页
方志是我国特有的一种具有极高史料价值的地方文献,对其进行数字化处理并实施知识挖掘,对传承传播中华传统文化、建设文化强国具有重要意义。命名实体识别作为一种基础性技术与关键环节,对方志知识组织与发现具有重要影响。目前,虽然方... 方志是我国特有的一种具有极高史料价值的地方文献,对其进行数字化处理并实施知识挖掘,对传承传播中华传统文化、建设文化强国具有重要意义。命名实体识别作为一种基础性技术与关键环节,对方志知识组织与发现具有重要影响。目前,虽然方志命名实体识别已经取得了一定进展,但是仍缺乏适应方志文本特征与领域资源特征的系统化技术方案。基于此,本文提出融合多维特征与Bi-LSTM-CRF的戏曲类方志命名实体识别模型。首先,结合句法特征与符号、尾词、构词、上下文和负例等文本特征,对方志文献中的戏曲类实体特质进行解析;其次,利用在长文本结构中表现优异的Bi-LSTM-CRF模型,借助已解析的戏曲类实体特征,提升实体识别效率;最后,以《楚剧志》为具体对象开展实证研究,结果表明,本文提出的模型在命名实体识别效果上优于基准模型,F1值达到0.869。 展开更多
关键词 方志文献 戏曲类方志 命名实体识别 bi-lstm-crf 多维特征分析
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部