期刊文献+
共找到84篇文章
< 1 2 5 >
每页显示 20 50 100
基于迁移学习和BiLSTM-CRF的中文命名实体识别 被引量:53
1
作者 武惠 吕立 于碧辉 《小型微型计算机系统》 CSCD 北大核心 2019年第6期1142-1147,共6页
针对中文命名实体识别问题,该文提出了一种基于迁移学习和深度学习的TrBiLSTM-CRF模型.该模型采用基于实例的迁移学习算法,通过权值生成和样本选择,将源域的知识迁移到目标域,有效地解决了深度学习对少量数据学习能力不足的问题;通过词... 针对中文命名实体识别问题,该文提出了一种基于迁移学习和深度学习的TrBiLSTM-CRF模型.该模型采用基于实例的迁移学习算法,通过权值生成和样本选择,将源域的知识迁移到目标域,有效地解决了深度学习对少量数据学习能力不足的问题;通过词向量、BiLSTM、CRF等操作融合了上下文语义信息,克服了对人工特征和专家知识的依赖.实验结果表明,TrBiLSTMCRF模型在小规模数据集上进行中文机构名命名实体识别时,其准确率、召回率和F值分别为91. 57%、72. 29%和0. 80%,相比于该文提到的其他方法,取得了较好的效果. 展开更多
关键词 中文命名实体识别 TrBiLSTM-CRF 迁移学习 深度学习 词向量
下载PDF
基于小规模尾字特征的中文命名实体识别研究 被引量:26
2
作者 冯元勇 孙乐 +1 位作者 张大鲲 李文波 《电子学报》 EI CAS CSCD 北大核心 2008年第9期1833-1838,共6页
本文针对难度最大的两类命名实体(地名和机构名)在条件随机场框架下首次引入了小规模的常用尾字特征.实验表明,该特征与词类特征具有一定的互补性,联合使用可以以较小的训练代价显著提高专有名词的识别性能,特别是机构名的识别精度.该... 本文针对难度最大的两类命名实体(地名和机构名)在条件随机场框架下首次引入了小规模的常用尾字特征.实验表明,该特征与词类特征具有一定的互补性,联合使用可以以较小的训练代价显著提高专有名词的识别性能,特别是机构名的识别精度.该系统在我国863简体命名实体识别评测语料上专名(人名、地名和机构名)总体F1值达88.76%,超过当年最佳系统8.63个百分点.在SIGHAN 2006命名实体识别语料上的结果也居于前列. 展开更多
关键词 中文命名实体识别 小规模尾字特征 条件随机场 自然语言处理 机器学习
下载PDF
基于单字提示特征的中文命名实体识别快速算法 被引量:24
3
作者 冯元勇 孙乐 +1 位作者 李文波 张大鲲 《中文信息学报》 CSCD 北大核心 2008年第1期104-110,共7页
近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降... 近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。 展开更多
关键词 计算机应用 中文信息处理 中文命名实体识别 条件随机场 自然语言处理 机器学习
下载PDF
基于深度学习的中文命名实体识别最新研究进展综述 被引量:25
4
作者 张汝佳 代璐 +1 位作者 王邦 郭鹏 《中文信息学报》 CSCD 北大核心 2022年第6期20-35,共16页
中文命名实体识别(CNER)任务是问答系统、机器翻译、信息抽取等自然语言应用的基础底层任务。传统的CNER系统借助人工设计的领域词典和语法规则,取得了不错的实验效果,但存在泛化能力弱、鲁棒性差、维护难等缺点。近年来兴起的深度学习... 中文命名实体识别(CNER)任务是问答系统、机器翻译、信息抽取等自然语言应用的基础底层任务。传统的CNER系统借助人工设计的领域词典和语法规则,取得了不错的实验效果,但存在泛化能力弱、鲁棒性差、维护难等缺点。近年来兴起的深度学习技术通过端到端的方式自动提取文本特征,弥补了上述不足。该文对基于深度学习的中文命名实体识别任务最新研究进展进行了综述,先介绍中文命名实体识别任务的概念、应用现状和难点,接着简要介绍中文命名实体识别任务的常用数据集和评估方法,并按照主要网络架构对中文命名实体识别任务上的深度学习模型进行分类和梳理,最后对这一任务的未来研究方向进行了展望。 展开更多
关键词 中文命名实体识别 深度学习 综述
下载PDF
基于卷积神经网络的中文景点识别研究 被引量:15
5
作者 刘小安 彭涛 《计算机工程与应用》 CSCD 北大核心 2020年第4期140-145,共6页
命名实体识别是自然语言处理任务的重要环节。近年来,基于深度学习的通用命名实体识别模型取得显著效果。而在旅游领域,中文旅游景点实体识别主要依赖于特征工程的方法。提出一种基于CNN-BiLSTM-CRF的网络模型,该模型不使用任何人工特征... 命名实体识别是自然语言处理任务的重要环节。近年来,基于深度学习的通用命名实体识别模型取得显著效果。而在旅游领域,中文旅游景点实体识别主要依赖于特征工程的方法。提出一种基于CNN-BiLSTM-CRF的网络模型,该模型不使用任何人工特征,通过神经网络充分对文本的局部信息特征进行抽象化抽取和表示,并学习和利用文本的上下文信息,实现对景点实体的识别。实验结果显示,该方法能够有效识别中文旅游景点实体,并在实验中取得F1值93.9%的效果。 展开更多
关键词 中文命名实体识别 深度学习 景点识别 卷积神经网络(CNN) 双向长短记忆网络(BiLSTM) 条件随机场(CRF)
下载PDF
深度学习中文命名实体识别研究综述 被引量:13
6
作者 康怡琳 孙璐冰 +1 位作者 朱容波 李梦瑶 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第11期44-53,共10页
针对目前中文命名实体识别研究集中在输入文本的特征的提取,且输入的嵌入表示直接影响模型的性能这一特点,从背景知识、研究现状和未来发展等方面对中文命名实体识别的研究展开全面的调查.回顾了命名实体识别的发展进程,解释中文命名实... 针对目前中文命名实体识别研究集中在输入文本的特征的提取,且输入的嵌入表示直接影响模型的性能这一特点,从背景知识、研究现状和未来发展等方面对中文命名实体识别的研究展开全面的调查.回顾了命名实体识别的发展进程,解释中文命名实体识别的研究难点,归纳不同的研究方法,分为基于字的模型、基于词的模型和基于字-词的模型;介绍目前中文命名实体识别的主流数据集、标注方法和评价指标,从不同角度分析了各数据集的特点;讨论了近几年深度学习技术在中文命名实体识别中的最新研究进展,介绍各分类下具有代表性的模型及性能对比,分析性能优劣原因;总结了中文命名实体识别当下所面临的一些挑战,讨论了未来更具有研究价值的方向,促进中文命名实体识别的进一步发展. 展开更多
关键词 中文命名实体识别 深度学习 自然语言处理 基于字-词的模型 基于字的模型 基于词的模型
原文传递
融合空洞卷积神经网络与层次注意力机制的中文命名实体识别 被引量:12
7
作者 陈茹 卢先领 《中文信息学报》 CSCD 北大核心 2020年第8期70-77,共8页
该文针对现有的命名实体识别(named entity recognition,NER)模型未考虑到文本层次化结构对实体识别的重要作用,以及循环神经网络受其递归性的限制导致计算效率低下等问题,构建了IDC-HSAN模型(Iterated Dilated Convolutions Neural Net... 该文针对现有的命名实体识别(named entity recognition,NER)模型未考虑到文本层次化结构对实体识别的重要作用,以及循环神经网络受其递归性的限制导致计算效率低下等问题,构建了IDC-HSAN模型(Iterated Dilated Convolutions Neural Networks and Hierarchical Self-attention Network)。该模型通过迭代的空洞卷积神经网络(ID-CNN)充分利用GPU的并行性大大降低了使用长短时记忆网络的时间代价。然后,采用层次化注意力机制捕获重要的局部特征和全局上下文中的重要语义信息。此外,为了丰富嵌入信息,加入了偏旁部首信息。最后,在不同领域数据集上的实验结果表明,IDC-HSAN模型能够从文本中获取有用的实体信息,和传统的深度网络模型、结合注意力机制的命名实体识别模型相比识别效果有所提升。 展开更多
关键词 注意力机制 迭代空洞卷积神经网络 中文命名实体识别
下载PDF
基于条件随机场的农业命名实体识别 被引量:11
8
作者 张剑 吴青 +4 位作者 羊昕旖 王彬聪 吴宣为 徐向英 吕强 《计算机与现代化》 2018年第1期123-126,共4页
为满足农业命名实体领域中多样而精确的需求,本文采用基于条件随机场的命名实体识别,将农业命名实体分为病虫害、作物、化肥及农药4种命名实体,并用自定义标注集对其进行标注,以ICTCLAS分词系统来对收集到的语料进行分词,通过添加多种... 为满足农业命名实体领域中多样而精确的需求,本文采用基于条件随机场的命名实体识别,将农业命名实体分为病虫害、作物、化肥及农药4种命名实体,并用自定义标注集对其进行标注,以ICTCLAS分词系统来对收集到的语料进行分词,通过添加多种不同的特征以提高识别率。最终训练得到的模型对各命名实体识别的准确率达到了93%以上,召回率达到了84%以上,证明对农业命名实体细致划分为多个实体是可行的。 展开更多
关键词 中文命名实体识别 条件随机场 农业
下载PDF
深度学习中文命名实体识别研究进展 被引量:3
9
作者 李莉 奚雪峰 +2 位作者 盛胜利 崔志明 徐家保 《计算机工程与应用》 CSCD 北大核心 2023年第24期46-69,共24页
中文命名实体识别(CNER)指识别中文文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。近年来,深度学习技术依托其端到端的方法,自动学习到更深层次和更抽象的数据特征,摆脱了人工标注的依赖,解决了高维特征空间的数据... 中文命名实体识别(CNER)指识别中文文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。近年来,深度学习技术依托其端到端的方法,自动学习到更深层次和更抽象的数据特征,摆脱了人工标注的依赖,解决了高维特征空间的数据稀疏问题,从而逐渐成为中文命名实体识别方法的主流。回顾了命名实体识别的发展进程和CNER的特殊性和难点;围绕着中文命名实体识别的不同处理特点,将基于深度学习的中文命名实体识别的方法分类为扁平实体边界问题、中文嵌套命名实体识别和CNER小样本问题处理三个领域,并具体阐述这三类领域的模型、细分领域和最近的研究进展并整理了部分典型深度学习方法在相关数据集上的实验结果;再次总结了中文命名实体识别任务的常用数据集和评估方法;指出了当前中文命名实体识别技术面临的挑战和未来的研究方向。 展开更多
关键词 中文命名实体识别 深度学习 实体边界 中文嵌套命名实体识别 低资源中文命名实体识别
下载PDF
基于Transformer和隐马尔科夫模型的中文命名实体识别方法 被引量:6
10
作者 李健 熊琦 +1 位作者 胡雅婷 刘孔宇 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第5期1427-1434,共8页
提出了一种基于Transformer和隐马尔科夫模型的字级别中文命名实体识别方法。本文改进了Transformer模型的位置编码计算函数,使修改后的位置编码函数能表达字符之间的相对位置信息和方向性。使用Transformer模型编码后的字符序列计算转... 提出了一种基于Transformer和隐马尔科夫模型的字级别中文命名实体识别方法。本文改进了Transformer模型的位置编码计算函数,使修改后的位置编码函数能表达字符之间的相对位置信息和方向性。使用Transformer模型编码后的字符序列计算转移矩阵和发射矩阵,建立隐马尔科夫模型生成一组命名实体软标签。将隐马尔科夫模型生成的软标签带入到Bert-NER模型中,使用散度损失函数更新Bert-NER模型参数,输出最终的命名实体强标签,从而找出命名实体。经过对比实验,本文方法在中文CLUENER-2020数据集和Weibo数据集上,F_(1)值达到75.11%和68%,提升了中文命名实体识别的效果。 展开更多
关键词 人工智能 中文命名实体识别 隐马尔科夫模型 Transformer编码器 位置编码
原文传递
基于深度学习的中文命名实体识别研究综述 被引量:6
11
作者 祁鹏年 廖雨伦 覃飙 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1857-1868,共12页
命名实体识别(Named Entity Recognition, NER)在自然语言处理领域扮演着至关重要的角色,它是关系抽取、机器翻译、文本摘要、问答系统等自然语言任务的基础.中文命名实体识别(Chinese Named Entity Recognition, CNER)是中文语境下的NE... 命名实体识别(Named Entity Recognition, NER)在自然语言处理领域扮演着至关重要的角色,它是关系抽取、机器翻译、文本摘要、问答系统等自然语言任务的基础.中文命名实体识别(Chinese Named Entity Recognition, CNER)是中文语境下的NER方案.已有的文献只分析了技术的不同发展阶段,没有对基于深度学习的方法进行系统和深入的总结.该文详细介绍了基于深度学习的研究方法,并从模型分类、数据集、评价标准以及性能分析四个方面对CNER领域中已有的研究成果进行综合评述,最后讨论了其面临的挑战和机遇. 展开更多
关键词 深度学习 自然语言处理 中文命名实体识别
下载PDF
引入词集级注意力机制的中文命名实体识别方法 被引量:8
12
作者 钟诗胜 陈曦 +1 位作者 赵明航 张永健 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第5期1098-1105,共8页
目前许多研究通过引入外部词汇信息提高中文命名实体识别的效果,这些研究通常在词集内对词向量进行加权将词信息整合到字表示中,但忽略了各个词集的重要度不同。为此,本文提出了一种引入词集级注意力机制的中文命名实体识别方法,在引入... 目前许多研究通过引入外部词汇信息提高中文命名实体识别的效果,这些研究通常在词集内对词向量进行加权将词信息整合到字表示中,但忽略了各个词集的重要度不同。为此,本文提出了一种引入词集级注意力机制的中文命名实体识别方法,在引入外部词汇信息的基础上,根据字在词中的位置划分词集、获得词集向量,进而建立词集级别的注意力机制,强制性地将注意力集中在适当的词集,忽略不可靠的部分,从而提高中文命名实体识别效果。最后,通过多个数据集上的实验验证了该方法的有效性。 展开更多
关键词 人工智能 中文命名实体识别 词集级 注意力机制 外部词汇信息
原文传递
基于深度学习的中文命名实体识别综述 被引量:9
13
作者 郑洪浩 宋旭晖 +2 位作者 于洪涛 李邵梅 郝一诺 《信息工程大学学报》 2021年第5期590-596,共7页
命名实体识别作为信息抽取的核心任务,能够从文本中识别出各类命名实体。近年来,深度学习技术在字词表示、特征提取等方面上的应用,使中文命名实体识别任务取得了较为丰富的研究成果。目前,基于深度学习的中文命名实体识别技术,在特征... 命名实体识别作为信息抽取的核心任务,能够从文本中识别出各类命名实体。近年来,深度学习技术在字词表示、特征提取等方面上的应用,使中文命名实体识别任务取得了较为丰富的研究成果。目前,基于深度学习的中文命名实体识别技术,在特征提取的深度和模型的精确度上已逐渐超过了传统的基于规则的方法、基于特征工程的有监督方法和基于无监督的方法。围绕深度学习的识别框架,将现有基于深度学习的中文命名实体识别方法分嵌入层、编码层和标签解码层三部分进行介绍,并对未来可能的研究方向进行探讨和展望。 展开更多
关键词 中文命名实体识别 深度学习 嵌入层 编码层 标签解码层
下载PDF
基于BERT的中文电子病历命名实体识别 被引量:8
14
作者 李灵芳 杨佳琦 +2 位作者 李宝山 杜永兴 胡伟健 《内蒙古科技大学学报》 CAS 2020年第1期71-77,共7页
电子病历中蕴含着丰富的医学信息,这些医学信息对疾病的诊疗具有十分重要的意义.利用命名实体识别技术对电子病历进行信息抽取已成为研究的热点之一,为了更加高效准确的抽取中文电子病历中的实体,提出了BERT-BiLSTM-CRF命名实体识别模型... 电子病历中蕴含着丰富的医学信息,这些医学信息对疾病的诊疗具有十分重要的意义.利用命名实体识别技术对电子病历进行信息抽取已成为研究的热点之一,为了更加高效准确的抽取中文电子病历中的实体,提出了BERT-BiLSTM-CRF命名实体识别模型.模型在传统BiLSTM-CRF模型基础上,融合了BERT字嵌入模型,更好的结合文章上下文,充分考虑了一词多义等问题.实验结果证明,该模型在中文电子病历命名实体识别任务中取得了良好的效果,较现有命名实体识别方法,从准确率、召回率、F1值3方面都有着明显的提升.电子病历命名实体识别任务准确度的提高,对进一步构建医学知识图谱、医学知识库等任务有着重大帮助. 展开更多
关键词 中文命名实体识别 BERT模型 中文电子病历 预训练语言模型
下载PDF
Bert-BLSTM-CRF模型的中文命名实体识别 被引量:8
15
作者 王远志 曹子莹 《安庆师范大学学报(自然科学版)》 2021年第1期59-65,共7页
中文命名实体识别方法中采用较多的是神经网络模型,但该模型在训练过程中存在字向量表征过于单一的问题,无法很好地处理字的多义性特征。因此,提出一种基于Bert-BLSTM-CRF模型的中文命名实体识别研究方法,使用Bert预训练语言模型,根据... 中文命名实体识别方法中采用较多的是神经网络模型,但该模型在训练过程中存在字向量表征过于单一的问题,无法很好地处理字的多义性特征。因此,提出一种基于Bert-BLSTM-CRF模型的中文命名实体识别研究方法,使用Bert预训练语言模型,根据字的上下文信息来丰富字的语义向量,将输出的字向量序列作为输入送入BLSTM-CRF模型进行训练。实验结果表明,此方法在中文命名实体识别任务上其准确率、召回率和F1值分别取得了94.80%、95.44%和95.12%的成绩,相较于其他传统方法,效果显著。 展开更多
关键词 中文实体识别 双向LSTM 条件随机场
下载PDF
词边界字向量的中文命名实体识别 被引量:8
16
作者 姚霖 刘轶 +1 位作者 李鑫鑫 刘宏 《智能系统学报》 CSCD 北大核心 2016年第1期37-42,共6页
常见的基于机器学习的中文命名实体识别系统往往使用大量人工提取的特征,但特征提取费时费力,是一件十分繁琐的工作。为了减少中文命名实体识别对特征提取的依赖,构建了基于词边界字向量的中文命名实体识别系统。该方法利用神经元网络... 常见的基于机器学习的中文命名实体识别系统往往使用大量人工提取的特征,但特征提取费时费力,是一件十分繁琐的工作。为了减少中文命名实体识别对特征提取的依赖,构建了基于词边界字向量的中文命名实体识别系统。该方法利用神经元网络从大量未标注数据中,自动抽取出蕴含其中的特征信息,生成字特征向量。同时考虑到汉字不是中文语义的最基本单位,单纯的字向量会由于一字多义造成语义的混淆,因此根据同一个字在词中处于不同位置大多含义不同的特点,将单个字在词语中所处的位置信息加入到字特征向量中,形成词边界字向量,将其用于深度神经网络模型训练之中。在Sighan Bakeoff-3(2006)语料中取得了F189.18%的效果,接近当前国际先进水平,说明了该系统不仅摆脱了对特征提取的依赖,也减少了汉字一字多义产生的语义混淆。 展开更多
关键词 机器学习 中文命名体识别 深度神经网络 特征向量 特征提取
下载PDF
融合词信息嵌入的注意力自适应命名实体识别 被引量:3
17
作者 赵萍 窦全胜 +2 位作者 唐焕玲 姜平 陈淑振 《计算机工程与应用》 CSCD 北大核心 2023年第8期167-174,共8页
缺少分词信息及未登录词、无关词干扰是字符级中文命名实体识别面临的主要问题,提出了融合词信息嵌入的注意力自适应中文命名实体识别模型,在新词发现的基础上,将字向量嵌入与词级信息嵌入融合作为模型输入,减少了未登录词对模型的影响... 缺少分词信息及未登录词、无关词干扰是字符级中文命名实体识别面临的主要问题,提出了融合词信息嵌入的注意力自适应中文命名实体识别模型,在新词发现的基础上,将字向量嵌入与词级信息嵌入融合作为模型输入,减少了未登录词对模型的影响,并增强了实体特征的显著性,使实体特征更容易被学习器获取;同时,在注意力机制中引入动态缩放因子,自适应地调整相关实体和无关词的注意力分布,一定程度上减小了无关词对模型的干扰。将该方法在公共数据集上进行实验,实验结果证明了方法的有效性。 展开更多
关键词 中文命名实体识别 注意力机制 动态缩放因子 未登录词
下载PDF
基于含边界词性特征的中文命名实体识别 被引量:7
18
作者 邱莎 王付艳 +3 位作者 申浩如 段玻 阿圆 丁海燕 《计算机工程》 CAS CSCD 2012年第13期128-130,共3页
根据词性在任务中可能出现的特征表达,在字粒度一级,基于条件随机场模型,对词性特征在中文命名实体识别任务中的应用进行研究,提出一种将词性和词边界合成为一个特征项的方法。在相同实验环境下针对多种词性特征的应用情况,采用序列标... 根据词性在任务中可能出现的特征表达,在字粒度一级,基于条件随机场模型,对词性特征在中文命名实体识别任务中的应用进行研究,提出一种将词性和词边界合成为一个特征项的方法。在相同实验环境下针对多种词性特征的应用情况,采用序列标注的方式在公共语料上进行多次中文命名实体识别实验。通过对多次实验结果的比较分析得出,二级词性与词边界合成的特征在系统执行性能和识别效果等方面均为最优。 展开更多
关键词 中文命名实体识别 条件随机场 特征模板 词性 词边界 标注集
下载PDF
中文电子病历命名实体识别算法BLF-MarkBERT
19
作者 潘旭 余艳梅 +1 位作者 盛西方 陶青川 《现代计算机》 2024年第9期35-38,65,共5页
随着深度学习技术的发展,中文命名实体识别在各个领域取得了显著进展,特别是在中文电子病历领域,它成为了医学信息管理领域的重要任务。中文电子病历命名实体识别从电子病历中自动识别和分类命名实体,提高了医学信息管理效率和临床决策... 随着深度学习技术的发展,中文命名实体识别在各个领域取得了显著进展,特别是在中文电子病历领域,它成为了医学信息管理领域的重要任务。中文电子病历命名实体识别从电子病历中自动识别和分类命名实体,提高了医学信息管理效率和临床决策支持,促进了医学智能信息化发展。为进一步提升效果,对MarkBERT方法进行研究,在其基础上改进并实现了一种融合双向长短时记忆网络和解码方式的深度学习模型BLF-MarkBERT。在CCKS2019数据集上的实验结果表明,BLF-MarkBERT在准确率P、召回率R和F1分数这三个评估指标上均优于对比算法,表明了该模型的优越性。 展开更多
关键词 中文命名实体识别 MarkBERT BiLSTM 中文电子病历
下载PDF
RIB-NER:基于跨度的中文命名实体识别模型
20
作者 田红鹏 吴璟玮 《计算机工程与科学》 CSCD 北大核心 2024年第7期1311-1320,共10页
命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错... 命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错误分类。针对这个问题,提出基于跨度的命名实体识别模型RIB-NER。首先,以RoBERTa-wwm-ext作为模型嵌入层,提供字符级嵌入,以获得更多的上下文语义信息和词汇信息。其次,利用IDCNN的并行卷积核来增强词之间的位置信息,从而使词与词之间联系更加紧密。同时,在模型中融合BiLSTM网络来获取上下文信息。最后,采用双仿射模型对句子中的开始标记和结束标记评分,使用这些标记探索跨度。在MSRA和Weibo 2个语料库上的实验结果表明,RIB-NER能够较为准确地识别实体边界,并分别获得了95.11%和73.94%的F1值。与传统深度学习相比,有更好的识别效果。 展开更多
关键词 中文命名实体识别 双仿射模型 迭代膨胀卷积神经网络 预训练模型 跨度
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部