期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
基于BERT-BiLSTM-CRF模型的中文实体识别 被引量:94
1
作者 谢腾 杨俊安 刘辉 《计算机系统应用》 2020年第7期48-55,共8页
命名实体识别是自然语言处理的一项关键技术.基于深度学习的方法已被广泛应用到中文实体识别研究中.大多数深度学习模型的预处理主要注重词和字符的特征抽取,却忽略词上下文的语义信息,使其无法表征一词多义,因而实体识别性能有待进一... 命名实体识别是自然语言处理的一项关键技术.基于深度学习的方法已被广泛应用到中文实体识别研究中.大多数深度学习模型的预处理主要注重词和字符的特征抽取,却忽略词上下文的语义信息,使其无法表征一词多义,因而实体识别性能有待进一步提高.为解决该问题,本文提出了一种基于BERT-BiLSTM-CRF模型的研究方法.首先通过BERT模型预处理生成基于上下文信息的词向量,其次将训练出来的词向量输入BiLSTM-CRF模型做进一步训练处理.实验结果表明,该模型在MSRA语料和人民日报语料库上都达到相当不错的结果,F1值分别为94.65%和95.67%. 展开更多
关键词 命名实体识别 BERT模型 双向长短期记忆网络 条件随机场 词向量
下载PDF
命名实体识别研究 被引量:67
2
作者 张晓艳 王挺 陈火旺 《计算机科学》 CSCD 北大核心 2005年第4期44-48,共5页
命名实体识别是文本信息处理的重要基础,已经逐步成为自然语言处理的一项关键技术。其基于规则、统计、机器学习的研究方法及成果,都推动了自然语言处理研究的发展,促进了自然语言研究与应用的紧密结合。本文回顾了命名实体识别技术的... 命名实体识别是文本信息处理的重要基础,已经逐步成为自然语言处理的一项关键技术。其基于规则、统计、机器学习的研究方法及成果,都推动了自然语言处理研究的发展,促进了自然语言研究与应用的紧密结合。本文回顾了命名实体识别技术的发展过程,分析了主要的方法和技术,并展望了未来的发展趋势。 展开更多
关键词 命名实体 自然语言处理 文本信息处理 关键技术 基于规则 研究方法 机器学习 紧密结合 发展过程 识别技术 发展趋势
下载PDF
融入自注意力机制的社交媒体命名实体识别 被引量:45
3
作者 李明扬 孔芳 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第6期461-467,共7页
相比规范新闻文本中命名实体识别(named entity recognition,NER),中文社交媒体中命名实体识别的性能偏低,这主要受限于文本的规范性和标注语料的规模。近年来中文社交媒体的命名实体识别研究主要针对标注语料规模小这一问题,倾向于使... 相比规范新闻文本中命名实体识别(named entity recognition,NER),中文社交媒体中命名实体识别的性能偏低,这主要受限于文本的规范性和标注语料的规模。近年来中文社交媒体的命名实体识别研究主要针对标注语料规模小这一问题,倾向于使用外部知识或者借助联合训练来提升最终的识别性能,但对社交媒体文本不规范导致的对文本自身蕴含特征的挖掘不够这一问题的研究很少。该文着眼于文本自身,提出了一种结合双向长短时记忆和自注意力机制的命名实体识别方法。该方法通过在多个不同子空间捕获上下文相关信息来更好地理解和表示句子结构,充分挖掘文本自身蕴含的特征,并最终提升不规范文本的实体识别性能。在Weibo NER公开语料上进行了多组对比实验,实验结果验证了方法的有效性。结果表明:在不使用外部资源和联合训练的情况下,命名实体识别的F1值达到了58.76%。 展开更多
关键词 命名实体识别 中文社交媒体 自注意力机制
原文传递
基于BERT的警情文本命名实体识别 被引量:44
4
作者 王月 王孟轩 +1 位作者 张胜 杜渂 《计算机应用》 CSCD 北大核心 2020年第2期535-540,共6页
针对警情领域关键实体信息难以识别的问题,提出一种基于BERT的神经网络模型BERT-BiLSTMAttention-CRF用于识别和提取相关命名实体,且针对不同案由设计了相应的实体标记注规范。该模型使用BERT预训练词向量代替传统Skip-gram和CBOW等方... 针对警情领域关键实体信息难以识别的问题,提出一种基于BERT的神经网络模型BERT-BiLSTMAttention-CRF用于识别和提取相关命名实体,且针对不同案由设计了相应的实体标记注规范。该模型使用BERT预训练词向量代替传统Skip-gram和CBOW等方式训练的静态词向量,提升了词向量的表证能力,同时解决了中文语料采用字向量训练时词语边界的划分问题;还使用注意力机制改进经典的命名实体识别(NER)模型架构BiLSTM-CRF。BERT-BiLSTM-Attention-CRF模型在测试集上的准确率达91%,较CRF++的基准模型提高7%,也高于BiLSTM-CRF模型86%的准确率,其中相关人名、损失金额、处理方式等实体的F1值均高于0.87。 展开更多
关键词 警情文本 命名实体识别 预训练语言模型 标注规范 词向量
下载PDF
基于BiLSTM-CRF的商情实体识别模型 被引量:41
5
作者 张应成 杨洋 +3 位作者 蒋瑞 全兵 张利君 任晓雷 《计算机工程》 CAS CSCD 北大核心 2019年第5期308-314,共7页
结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的... 结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的前向、后向文本特征,并通过CRF提取出双向本文特征中相应的实体。实验结果表明,与传统机器学习算法CRF相比,该模型3类实体的精确率、召回率和F1值平均提升15.21%、12.06%和13.70%。 展开更多
关键词 条件随机场 双向长短时记忆网络 语言模型 命名实体识别 深度学习
下载PDF
基于深度学习的命名实体识别综述 被引量:32
6
作者 邓依依 邬昌兴 +2 位作者 魏永丰 万仲保 黄兆华 《中文信息学报》 CSCD 北大核心 2021年第9期30-45,共16页
命名实体识别是自然语言处理的基础任务之一,目的是从非结构化的文本中识别出所需的实体及类型,其识别的结果可用于实体关系抽取、知识图谱构建等众多实际应用。近些年,随着深度学习在自然语言处理领域的广泛应用,各种基于深度学习的命... 命名实体识别是自然语言处理的基础任务之一,目的是从非结构化的文本中识别出所需的实体及类型,其识别的结果可用于实体关系抽取、知识图谱构建等众多实际应用。近些年,随着深度学习在自然语言处理领域的广泛应用,各种基于深度学习的命名实体识别方法均取得了较好的效果,其性能全面超越传统的基于人工特征的方法。该文从三个方面介绍近期基于深度学习的命名实体识别方法:第一,从输入层、编码层和解码层出发,介绍命名实体识别的一般框架;第二,分析汉语命名实体识别的特点,着重介绍各种融合字词信息的模型;第三,介绍低资源的命名实体识别,主要包括跨语言迁移方法、跨领域迁移方法、跨任务迁移方法和集成自动标注语料的方法等。最后,总结相关工作,并提出未来可能的研究方向。 展开更多
关键词 命名实体识别 汉语命名实体识别 低资源命名实体识别 深度学习
下载PDF
基于LSTM-CRF的中医医案症状术语识别 被引量:33
7
作者 李明浩 刘忠 姚远哲 《计算机应用》 CSCD 北大核心 2018年第A02期42-46,共5页
目前中医文献和临床医案数字化、结构化程度较低,从文本中有效获取症状信息是医案结构化的首要任务之一。针对中医医案临床症状术语,提出了一种基于长短期记忆(LSTM)网络和条件随机场(CRF)的深度学习症状术语识别方法。首先,参考中医临... 目前中医文献和临床医案数字化、结构化程度较低,从文本中有效获取症状信息是医案结构化的首要任务之一。针对中医医案临床症状术语,提出了一种基于长短期记忆(LSTM)网络和条件随机场(CRF)的深度学习症状术语识别方法。首先,参考中医临床症状术语规范,根据常见症状的组成要素制定了额外的字符级别特征,结合预训练的字嵌入获得文本序列的向量表示;其次,通过双向长短期记忆网络建模症状术语字符分布特征与句内依赖,获得序列元素的概率分布矩阵;最后,通过条件随机场获得序列标注结果。在小规模训练集上的实验表明,该方法在中医临床症状术语识别任务上F1值最高达到了0. 78。同时,该方法与传统的使用条件随机场方法相比,能够有效地识别字符较多的长症状术语,与进行人工特征标注相比代价更小。 展开更多
关键词 命名实体识别 长短期记忆网络 条件随机场 中医医案 症状术语
下载PDF
CRF与规则相结合的地理空间命名实体识别 被引量:31
8
作者 鞠久朋 张伟伟 +1 位作者 宁建军 周国栋 《计算机工程》 CAS CSCD 北大核心 2011年第7期210-212,215,共4页
提出条件随机场(CRF)与规则相结合的地理空间命名实体识别方法。该方法以丰富的知识作为触发条件,用CRF对满足条件的片段作地名及机构名识别,识别出来的命名实体又被解构,CRF及知识用来进一步判断该命名实体是否表示事件发生地的地理空... 提出条件随机场(CRF)与规则相结合的地理空间命名实体识别方法。该方法以丰富的知识作为触发条件,用CRF对满足条件的片段作地名及机构名识别,识别出来的命名实体又被解构,CRF及知识用来进一步判断该命名实体是否表示事件发生地的地理空间信息。实验结果表明,统计与规则方法的结合以及解构算法有效提升了地理空间命名实体识别的性能,准确率、召回率和F1值分别达到92.86%、90.91%、91.87%。 展开更多
关键词 条件随机场 规则 地理空间属性 命名实体识别
下载PDF
基于最大熵的汉语人名地名识别方法研究 被引量:26
9
作者 钱晶 张杰 张涛 《小型微型计算机系统》 CSCD 北大核心 2006年第9期1761-1765,共5页
构建了一个基于最大熵原理的汉语人名地名自动识别混合模型.该模型分为训练和识别两个模块.先从训练语料中抽取特征,利用最大熵方法对特征进行训练.然后使用经过训练的特征,并结合动态词表和少量规则,对测试文本中的汉语人名地名进行识... 构建了一个基于最大熵原理的汉语人名地名自动识别混合模型.该模型分为训练和识别两个模块.先从训练语料中抽取特征,利用最大熵方法对特征进行训练.然后使用经过训练的特征,并结合动态词表和少量规则,对测试文本中的汉语人名地名进行识别.达到了比较满意的识别效果.最后对实验结果进行了分析. 展开更多
关键词 最大熵模型 专有名词识别 特征提取 语言学规则
下载PDF
中文命名实体识别综述 被引量:25
10
作者 赵山 罗睿 蔡志平 《计算机科学与探索》 CSCD 北大核心 2022年第2期296-304,共9页
中文命名实体识别(NER)任务是信息抽取领域内的一个子任务,其任务目标是给定一段非结构文本后,从句子中寻找、识别和分类相关实体,例如人名、地名和机构名称。中文命名实体识别是一个自然语言处理(NLP)领域的基本任务,在许多下游NLP任务... 中文命名实体识别(NER)任务是信息抽取领域内的一个子任务,其任务目标是给定一段非结构文本后,从句子中寻找、识别和分类相关实体,例如人名、地名和机构名称。中文命名实体识别是一个自然语言处理(NLP)领域的基本任务,在许多下游NLP任务中,包括信息检索、关系抽取和问答系统中扮演着重要角色。全面回顾了现有的基于神经网络的单词-字符晶格结构的中文NER模型。首先介绍了中文NER相比英语NER难度更大,存在着中文文本相关实体边界难以确定和中文语法结构复杂等难点及挑战。然后调研了在不同神经网络架构下(RNN、CNN、GNN和Transformer)最具代表性的晶格结构的中文NER模型。由于单词序列信息可以给基于字符的序列学习更多边界信息,为了显式地利用每个字符所相关的词汇信息,过去的这些工作提出通过词-字符晶格结构将单词信息整合到字符序列中。这些在中文NER任务上基于神经网络的单词-字符晶格结构的性能要明显优于基于单词或基于字符的方法。最后介绍了中文NER的数据集及评价标准。 展开更多
关键词 命名实体识别(ner) 晶格结构 神经网络
下载PDF
基于BiLSTM-CNN-CRF模型的维吾尔文命名实体识别 被引量:23
11
作者 买买提阿依甫 吾守尔.斯拉木 +1 位作者 帕丽旦.木合塔尔 杨文忠 《计算机工程》 CAS CSCD 北大核心 2018年第8期230-236,共7页
为在缺乏资源和不依赖人工特征的情况下提高维吾尔文命名实体的识别性能,构建基于BiLSTM-CNNCRF的神经网络模型。采用卷积神经网络训练具有维吾尔文单词的后缀、前缀等形态特征的字符向量,利用skipgram模型对大规模语料进行训练,生成具... 为在缺乏资源和不依赖人工特征的情况下提高维吾尔文命名实体的识别性能,构建基于BiLSTM-CNNCRF的神经网络模型。采用卷积神经网络训练具有维吾尔文单词的后缀、前缀等形态特征的字符向量,利用skipgram模型对大规模语料进行训练,生成具有语义信息的低维度稠密实数词向量。在此基础上,将字符向量、词性向量和词向量拼接的向量作为输入,构建适合维吾尔文命名实体识别的BiLSTM-CRF深层神经网络。实验结果表明,该模型能够解决命名实体的自动识别问题,具有较强的鲁棒性,F1值达到91.89%。 展开更多
关键词 递归神经网络 卷积神经网络 条件随机场 维吾尔文 命名实体识别
下载PDF
基于HMM的京剧机构命名实体识别算法 被引量:18
12
作者 乐娟 赵玺 《计算机工程》 CAS CSCD 2013年第6期266-271,286,共7页
针对机构命名实体识别效率低的问题,提出一种基于隐马尔科夫模型(HMM)的京剧机构命名实体识别算法。利用HMM模型标注文本切分结果的词性消除歧义,通过Viterbi算法计算某种分词结果所对应的可能性最大的词性序列。根据定制的名称识别规则... 针对机构命名实体识别效率低的问题,提出一种基于隐马尔科夫模型(HMM)的京剧机构命名实体识别算法。利用HMM模型标注文本切分结果的词性消除歧义,通过Viterbi算法计算某种分词结果所对应的可能性最大的词性序列。根据定制的名称识别规则,借助机构前缀词库、后缀词库获得机构名称左右边界,通过自动机算法识别语料中的机构命名实体,并将新词加载到分词词典中。针对京剧领域语料进行开放测试验证,结果表明,该算法的识别正确率可达到99%。 展开更多
关键词 开放领域 命名实体识别 隐马尔科夫模型 VITERBI算法 规则树
下载PDF
基于深度迁移学习的技术术语识别——以数控系统领域为例 被引量:18
13
作者 刘宇飞 尹力 +2 位作者 张凯 杨建中 郑文江 《情报杂志》 CSSCI 北大核心 2019年第10期168-175,共8页
[目的/意义]新兴术语识别是新兴技术预见的一项重要工作,专利文献是技术情报的最新来源,被广泛地用于新兴技术预见。专利文献易于使用,但是术语难以挖掘、抽取难度大,存在缺乏术语标签的问题,目前未发现针对专利文献运用命名实体识别(N... [目的/意义]新兴术语识别是新兴技术预见的一项重要工作,专利文献是技术情报的最新来源,被广泛地用于新兴技术预见。专利文献易于使用,但是术语难以挖掘、抽取难度大,存在缺乏术语标签的问题,目前未发现针对专利文献运用命名实体识别(NER)抽取技术术语的研究。[方法/过程]该文引入深度迁移学习的思想,利用成熟的公共领域源数据,运用Bi-LSTM(双向长短时记忆)模型实现跨领域迁移,有效识别技术术语并过滤高频非术语词串,通过聚类对识别术语划分技术类别。[结果/结论]以数控系统(CNC)领域专利文献为例,模型有效地将公共领域源数据已有知识迁移到科学领域目标数据,解决了专利文献少标注的问题,识别术语领域相关性强。以此划分的技术类别能为领域技术发展趋势研究提供数据支持。 展开更多
关键词 新兴技术预见 命名实体识别 深度迁移学习 数控系统 专利分析
下载PDF
命名实体识别的迁移学习研究综述 被引量:17
14
作者 李猛 李艳玲 林民 《计算机科学与探索》 CSCD 北大核心 2021年第2期206-218,共13页
命名实体识别(NER)是自然语言处理的核心应用任务之一。传统和深度命名实体识别方法严重依赖于大量具有相同分布的标注训练数据,模型可移植性差。然而在实际应用中数据往往都是小数据、个性化数据,收集足够的训练数据是非常困难的。在... 命名实体识别(NER)是自然语言处理的核心应用任务之一。传统和深度命名实体识别方法严重依赖于大量具有相同分布的标注训练数据,模型可移植性差。然而在实际应用中数据往往都是小数据、个性化数据,收集足够的训练数据是非常困难的。在命名实体识别中引入迁移学习,利用源域数据和模型完成目标域任务模型构建,提高目标领域的标注数据量和降低目标域模型对标注数据数量的需求,在处理资源匮乏命名实体识别任务上,具有非常好的效果。首先对命名实体识别方法和难点以及迁移学习方法进行概述;然后对近些年应用于命名实体识别的迁移学习方法,包括基于数据迁移学习、基于模型迁移学习和对抗迁移学习,进行全面综述,重点阐述了对抗迁移学习方法;最后进一步思考当前存在的问题并对未来的研究方向进行了展望。 展开更多
关键词 命名实体识别(ner) 迁移学习 对抗迁移学习 深度学习
下载PDF
小粒度策略下基于CRFs的军事命名实体识别方法 被引量:16
15
作者 单赫源 张海粟 吴照林 《装甲兵工程学院学报》 2017年第1期84-89,共6页
军事命名实体(Military Named Entities,MNEs)内部嵌套关系复杂、语法区分不明显,从而影响实体识别效果,针对这一问题,提出了一种小粒度策略下基于条件随机场(Conditional Random Fields,CRFs)的MNEs识别方法。运用小粒度策略,结合手工... 军事命名实体(Military Named Entities,MNEs)内部嵌套关系复杂、语法区分不明显,从而影响实体识别效果,针对这一问题,提出了一种小粒度策略下基于条件随机场(Conditional Random Fields,CRFs)的MNEs识别方法。运用小粒度策略,结合手工构建的MNEs标注语料进行建模,采用CRFs模型识别出不可再分的小粒度MNEs,再通过对小粒度MNEs进行组合得到完整的MNEs。最后,通过实验对该方法进行了验证,结果表明:在作战文书语料的开放测试中,MNEs识别的召回率达到72%以上,准确率达到85%以上。 展开更多
关键词 条件随机场 军事命名实体 命名实体识别 小粒度策略
原文传递
基于BERT的电机领域中文命名实体识别方法 被引量:16
16
作者 顾亦然 霍建霖 +2 位作者 杨海根 卢逸飞 郭玉雯 《计算机工程》 CAS CSCD 北大核心 2021年第8期78-83,92,共7页
针对电机领域实体识别精度较低的问题,提出一种融合BERT预训练语言模型的中文命名实体识别方法。利用BERT预训练语言模型增强字的语义表示并按照上下文特征动态生成字向量,将字向量序列输入双向长短期记忆神经网络进行双向编码,同时通... 针对电机领域实体识别精度较低的问题,提出一种融合BERT预训练语言模型的中文命名实体识别方法。利用BERT预训练语言模型增强字的语义表示并按照上下文特征动态生成字向量,将字向量序列输入双向长短期记忆神经网络进行双向编码,同时通过条件随机场算法标注出实体识别结果。根据电机文本特点对自建数据集进行标注,并将电机领域实体划分为实物、特性描述、问题/故障、方法/技术等4个类别。实验结果表明,与基于Bi LSTM-CRF、Bi LSTM-CNN和Bi GRU的实体识别方法相比,该方法具有更高的准确率、召回率和F1值,并且有效解决了电机领域命名实体识别任务中标注数据不足及实体边界模糊的问题。 展开更多
关键词 命名实体识别 BERT预训练语言模型 电机领域 深度学习 迁移学习
下载PDF
中文电子病历命名实体识别的研究与进展 被引量:16
17
作者 杜晋华 尹浩 冯嵩 《电子学报》 EI CAS CSCD 北大核心 2022年第12期3030-3053,共24页
海量电子病历(Electronic Medical Record,EMR)数据是支撑医疗智能化研究的重要原料,然而电子病历文本数据的半结构化甚至无结构化特点,造成后续对其分析利用的极大困难.虽然近年来基于深度学习的命名实体识别(Named Entity Recognition... 海量电子病历(Electronic Medical Record,EMR)数据是支撑医疗智能化研究的重要原料,然而电子病历文本数据的半结构化甚至无结构化特点,造成后续对其分析利用的极大困难.虽然近年来基于深度学习的命名实体识别(Named Entity Recognition,NER)成为对电子病历进行自动化信息抽取的核心技术,但鉴于中文电子病历(Chinese Electronic Medical Record,CEMR)具有包括病历文本的非规范性与专业性、医疗实体的独特性和标注语料的稀缺性在内的独特文本数据特征,该研究目前仍存在诸多挑战.本文对中文电子病历命名实体识别的研究与进展进行了综述,系统梳理了命名实体识别的概念、相关理论模型以及制约中文电子病历命名实体识别准确率和识别效率的主要原因;从技术发展角度详细分析了中文电子病历命名实体识别方法的变革历程;并对中文电子病历命名实体识别效果做了实验验证与深入分析,指出了现有模型的不足与改进方向.鉴于国内近年来与中文信息学处理相关的测评会议CCKS持续关注中文电子病历命名实体识别,本文特别对CCKS在该领域五年来的全部代表性测评论文做了纵横对比分析,并通过在主流模型上的深入实验与研究,为后续该领域的继续推进寻求了思路. 展开更多
关键词 中文电子病历 命名实体识别 深度学习 预训练模型 自然语言处理 医疗信息化
下载PDF
多头注意力与字词融合的中文命名实体识别 被引量:15
18
作者 赵丹丹 黄德根 +2 位作者 孟佳娜 谷丰 张攀 《计算机工程与应用》 CSCD 北大核心 2022年第7期142-149,共8页
命名实体识别(named entity recognition,NER)是自然语言处理中重要的基础任务,而中文命名实体识别(Chinese named entity recognition,CNER)因分词歧义和一词多义等问题使其尤显困难。针对这些问题,提出多头注意力机制(multi-heads att... 命名实体识别(named entity recognition,NER)是自然语言处理中重要的基础任务,而中文命名实体识别(Chinese named entity recognition,CNER)因分词歧义和一词多义等问题使其尤显困难。针对这些问题,提出多头注意力机制(multi-heads attention mechanism,Multi-Attention)与字词融合的中文命名实体识别模型(CWA-CNER)。将汉语文本字向量与其在句中可能成词的词向量进行拼接,并将其送入长短时记忆网络(bidirectional long short-term memory neural network,BiLSTM)提取上下文语义信息,进而利用多头注意力机制捕获句中元素间联系的紧密程度,最后通过条件随机场(conditional random field,CRF)进行实体标注。该模型在Boson数据集,1998和2014年《人民日报》三种语料上进行实验,其F1值均达到90%以上,结果表明了模型的有效性。 展开更多
关键词 命名实体识别(ner) 多头注意力机制 字词融合
下载PDF
基于ALBERT-BGRU-CRF的中文命名实体识别方法 被引量:12
19
作者 李军怀 陈苗苗 +2 位作者 王怀军 崔颖安 张爱华 《计算机工程》 CAS CSCD 北大核心 2022年第6期89-94,106,共7页
命名实体识别是知识图谱构建、搜索引擎、推荐系统等上层自然语言处理任务的重要基础,中文命名实体识别是对一段文本序列中的专有名词或特定命名实体进行标注分类。针对现有中文命名实体识别方法无法有效提取长距离语义信息及解决一词... 命名实体识别是知识图谱构建、搜索引擎、推荐系统等上层自然语言处理任务的重要基础,中文命名实体识别是对一段文本序列中的专有名词或特定命名实体进行标注分类。针对现有中文命名实体识别方法无法有效提取长距离语义信息及解决一词多义的问题,提出一种基于ALBERT-双向门控循环单元(BGRU)-条件随机场(CRF)模型的中文命名实体识别方法。使用ALBERT预训练语言模型对输入文本进行词嵌入获取动态词向量,有效解决了一词多义的问题。采用BGRU提取上下文语义特征进一步理解语义,获取长距离词之间的语义特征。将拼接后的向量输入至CRF层并利用维特比算法解码,降低错误标签输出概率。最终得到实体标注信息,实现中文命名实体识别。实验结果表明,ALBERT-BGRU-CRF模型在MSRA语料库上的中文命名实体识别准确率和召回率分别达到95.16%和94.58%,同时相比于片段神经网络模型和CNN-BiLSTM-CRF模型的F1值提升了4.43和3.78个百分点。 展开更多
关键词 命名实体识别 预训练语言模型 双向门控循环单元 条件随机场 词向量 深度学习
下载PDF
Lattice LSTM神经网络法中文医学文本命名实体识别模型研究 被引量:12
20
作者 王博冉 林夏 +2 位作者 朱晓东 朱万琳 马学华 《中国卫生信息管理杂志》 2019年第1期84-88,共5页
目的探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题。方法利用Lattice LSTM来表征句子中的词汇词(lexiconword)... 目的探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题。方法利用Lattice LSTM来表征句子中的词汇词(lexiconword),从而将潜在词信息整合到基于字符的长短期记忆网络—条件随机场(long short term memory-conditional random?eld,LSTM-CRF)模型中。进一步使用一个大型自动获取的词典来匹配句子,进而构建基于词的Lattice。利用Lattice LSTM结构自动控制从句子开头至结尾的信息流。结果门控单元可用于将来自不同路径的信息动态传送到每个字符。在NER数据基础上进行训练后,LatticeLSTM能够学会从语境中自动找到更有用的词汇,以取得更好的NER性能。结论与基于字符和词的NER方法相比,本文所提出的模型优势在于利用显性词汇信息而不是字符序列进行标注,同时较少出现分词误差。 展开更多
关键词 神经网络 中文医学文本 命名实体识别
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部