期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
基于学术论文全文的研究方法实体自动识别研究 被引量:34
1
作者 章成志 张颖怡 《情报学报》 CSSCI CSCD 北大核心 2020年第6期589-600,共12页
研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该... 研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该学术论文使用或该学术论文引用该研究方法实体用于分析或比较。梳理学术论文使用的研究方法实体,可以帮助学者快速了解学术论文的主旨内容。总结学术论文引用的研究方法实体,有助于理清学科领域中研究方法的演变和发展模式。因此,本文将研究方法分为论文使用研究方法和论文引用研究方法。本文比较双向长短时记忆网络等8种神经网络研究方法实体自动抽取模型,从中选择最优的模型进行研究方法实体的识别。实验结果表明,基于字向量的、结合条件随机场的双向长短时记忆网络联合训练模型在研究方法识别任务中表现出最高的性能。以《情报学报》近10年的论文全文为依据,分析抽取出的研究方法实体的使用情况。统计分析结果发现,情报学学科中与实验法相关的研究方法使用频次和引用频次均最高。 展开更多
关键词 研究方法识别 命名实体识别 深度学习 序列标注
下载PDF
非结构化信息抽取关键技术研究探讨 被引量:10
2
作者 周法国 王映龙 +1 位作者 杨炳儒 宋泽锋 《计算机工程与应用》 CSCD 北大核心 2009年第14期1-6,21,共7页
以基于内在认知机理的知识发现理论为指导,针对汉语命名实体识别的难点,充分考虑专家知识在命名实体识别中的作用;根据不同的实体类型,采用灵活变化的统计与规则相结合的方式;采用各种技术来研究信息抽取的任务,如:机器学习技术、篇章... 以基于内在认知机理的知识发现理论为指导,针对汉语命名实体识别的难点,充分考虑专家知识在命名实体识别中的作用;根据不同的实体类型,采用灵活变化的统计与规则相结合的方式;采用各种技术来研究信息抽取的任务,如:机器学习技术、篇章分析与理解技术、句法分析技术、图算法与图挖掘技术、词计算技术、快速全文检索技术等;该文探讨的是不仅要从文本中获取简单子句中的关系,还要获得跨句子、段落中的实体关系。 展开更多
关键词 信息抽取 内在认知机理 命名实体识别 共指消解 机器学习
下载PDF
基于BERT_IDCNN_CRF的军事领域命名实体识别研究 被引量:8
3
作者 张祺 李成军 刘敬蜀 《航天电子对抗》 2021年第5期56-60,共5页
提出了一种基于BERT_IDCNN_CRF的命名实体识别模型,旨在识别军事领域文本中的人名、部队、武器装备等实体。采集了公开军事网站上的部分军事文本信息作为生语料,采用BIO标注体系、预处理生成所需的熟语料。利用BERT融合了词的上下文信息... 提出了一种基于BERT_IDCNN_CRF的命名实体识别模型,旨在识别军事领域文本中的人名、部队、武器装备等实体。采集了公开军事网站上的部分军事文本信息作为生语料,采用BIO标注体系、预处理生成所需的熟语料。利用BERT融合了词的上下文信息,输入IDCNN层进行训练,最终将训练结果输入CRF层进行模型微调获得训练结果。与其他三个常见的模型相比,提出的BERT_IDCNN_CRF模型在F1分数上效果较好。 展开更多
关键词 军事领域 命名实体识别 深度学习 膨胀卷积
下载PDF
基于命名实体识别与Neo4j的中文电子病历知识图谱构建和应用 被引量:7
4
作者 许思特 孙木 《医学信息学杂志》 CAS 2022年第12期50-56,共7页
基于真实中文电子病历与网络爬取数据,构建病历实体识别模型,确定实体关系,进行知识图谱可视化展现,搭建基于规则匹配的问答系统。探索适用于中文电子病历的知识图谱与知识体系构建方法,提高医院统计部门相关审核工作效率,为人工智能技... 基于真实中文电子病历与网络爬取数据,构建病历实体识别模型,确定实体关系,进行知识图谱可视化展现,搭建基于规则匹配的问答系统。探索适用于中文电子病历的知识图谱与知识体系构建方法,提高医院统计部门相关审核工作效率,为人工智能技术在医疗卫生行业应用奠定基础。 展开更多
关键词 中文电子病历 RoBERTa 命名实体识别 知识图谱 Neo4j
下载PDF
基于语义相似度及命名实体识别的主观题自动评分方法 被引量:6
5
作者 王逸凡 李国平 《电子测量技术》 2019年第2期84-87,共4页
人工智能技术目前已运用于诸多领域,其中在教育行业的一个重要应用为主观题评分系统。文本相似度计算是主观题评分的一大难点,目前采用的基于同义词词林的词语相似度计算方法已经了取得较好的效果,但文本过长会导致传统词语相似度计算... 人工智能技术目前已运用于诸多领域,其中在教育行业的一个重要应用为主观题评分系统。文本相似度计算是主观题评分的一大难点,目前采用的基于同义词词林的词语相似度计算方法已经了取得较好的效果,但文本过长会导致传统词语相似度计算方法性能下降。该文采用拓展的命名实体识别方法将主观题的候选答案中部分关键词提取出来,采用改进的同义词林词语相似度计算方法将候选关键词与主观题标准答案中目标关键词进行相似度计算。所提方法能有效提升词语匹配效率,在原同义词林词语相似度算法基础上,提升了性能,有效缩短了计算时间。 展开更多
关键词 同义词词林 主观题 语义相似度 命名实体识别 自然语言处理
下载PDF
基于动态词典匹配的语义增强中文命名实体识别算法 被引量:6
6
作者 陈曙东 罗超 +1 位作者 欧阳小叶 李威 《无线电工程》 北大核心 2021年第7期519-525,共7页
在命名实体识别任务中,运用词典匹配的方法能够添加丰富的文本特征,但匹配到的词组信息多使用静态归一化的方法,缺乏自动推理能力。提出了基于动态词典匹配的语义增强中文命名实体识别方法。对输入句子中的字符,在词典中进行动态词组匹... 在命名实体识别任务中,运用词典匹配的方法能够添加丰富的文本特征,但匹配到的词组信息多使用静态归一化的方法,缺乏自动推理能力。提出了基于动态词典匹配的语义增强中文命名实体识别方法。对输入句子中的字符,在词典中进行动态词组匹配,利用神经网络对词组加权,结合word2vec与ALBERT得到字符的增强特征表示;在序列建模层运用BiLSTM对字符的word2vec向量与字符增强特征进行模型训练;在标签推理层运用条件随机场(Conditional Random Field,CRF)识别命名实体。在中文Resume和Weibo数据集上进行实验,验证结果表明,该方法比传统方法具有更好的效果。 展开更多
关键词 命名实体识别 词典匹配 语义增强 神经网络 ALBERT
下载PDF
基于预训练模型的军事领域命名实体识别研究 被引量:6
7
作者 童昭 王露笛 +1 位作者 朱小杰 杜一 《数据与计算发展前沿》 CSCD 2022年第5期120-128,共9页
【目的】为了解决开源非结构化军事领域数据的命名实体识别问题。【方法】本文提出基于预训练模型(Bidirectional Encoder Representations from Transformers,BERT)的命名实体识别方法,首先基于预训练BERT模型生成自建开源军事语料的... 【目的】为了解决开源非结构化军事领域数据的命名实体识别问题。【方法】本文提出基于预训练模型(Bidirectional Encoder Representations from Transformers,BERT)的命名实体识别方法,首先基于预训练BERT模型生成自建开源军事语料的动态特征词向量的字符表示,然后基于双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)完成语义特征提取,最后利用条件随机场模型(Conditional Random Fields,CRF)选出最优标签序列完成实体识别的任务。【结果】模型在自建的开源军事数据集上的实验结果表明,相较于基于统计模型和神经网络的方法,本文提出的方法可使准确率提升8%,F值提高11%,召回率提高10%。【局限】由于现阶段在开源军事领域中公开标注数据集较为缺乏,所以未能在开源军事语料上训练BERT模型。【结论】但本文提出的基于预训练模型的开源军事命名实体识别方法,在一定程度上解决了边界划分问题,同时解决了在数据集不足的情况下实体识别任务表现不佳的问题。 展开更多
关键词 命名实体识别 预训练模型 神经网络
下载PDF
多粒度融合嵌入的中文实体识别模型 被引量:6
8
作者 袁健 章海波 《小型微型计算机系统》 CSCD 北大核心 2022年第4期741-746,共6页
中文由于词边界模糊,字符信息获取不足等问题,使得中文实体识别较为困难.论文针对汉字的象形文字特点,提出一种结合字形特征的增强字符信息算法,该算法利用卷积神经网络和BERT模型得到增强字符向量;同时提出多粒度融合嵌入算法,利用注... 中文由于词边界模糊,字符信息获取不足等问题,使得中文实体识别较为困难.论文针对汉字的象形文字特点,提出一种结合字形特征的增强字符信息算法,该算法利用卷积神经网络和BERT模型得到增强字符向量;同时提出多粒度融合嵌入算法,利用注意力机制将增强字符向量与词向量融合,最终构建出多粒度融合嵌入的中文实体识别模型.实验表明,该模型在中文实体识别中优于其它常用模型. 展开更多
关键词 卷积神经网络 BERT 注意力机制 命名实体识别
下载PDF
多特征中文命名实体识别 被引量:5
9
作者 胥小波 王涛 +2 位作者 康睿 周刚 李天宁 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期51-57,共7页
命名实体识别任务是对文本中的实体进行定位,并将其分类至预定义的类别中.目前主流的中文命名实体识别的模型是基于字符的命名实体识别模型.该模型在使用句法特征之前,需先进行分词,不能很好的引入句子的句法信息.另外,基于字符的模型... 命名实体识别任务是对文本中的实体进行定位,并将其分类至预定义的类别中.目前主流的中文命名实体识别的模型是基于字符的命名实体识别模型.该模型在使用句法特征之前,需先进行分词,不能很好的引入句子的句法信息.另外,基于字符的模型没有利用词典中的先验词典信息,以及中文偏旁部首蕴含的象形信息.针对上述问题,论文提出了融合句法和多粒度语义信息的多特征中文命名实体识别模型.实验证明论文模型相对目前主流模型有了较大的提高,同时论文还通过实验分析了各种特征对模型识别效果的影响. 展开更多
关键词 命名实体识别 中文 多特征 自然语言处理
下载PDF
面向小样本命名实体识别的数据增强算法改进策略研究 被引量:5
10
作者 刘兴丽 范俊杰 马海群 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第10期128-141,共14页
【目的】提出适用于小样本命名实体识别的数据增强改进算法策略。【方法】以领域命名实体识别任务为例,基于简单数据增强(EDA)算法提出多维度的改进策略:多种领域词典混合的实体替换、领域语义分类词典的词性替换、语义保护机制的随机... 【目的】提出适用于小样本命名实体识别的数据增强改进算法策略。【方法】以领域命名实体识别任务为例,基于简单数据增强(EDA)算法提出多维度的改进策略:多种领域词典混合的实体替换、领域语义分类词典的词性替换、语义保护机制的随机删除、词性保护的随机插入策略以及4种方法改进的组合策略,并分别进行命名实体识别模型训练。【结果】领域小样本数据增强改进策略的命名实体识别实验结果显示:单策略简单数据增强改进前后效果有所提升,F值分别提升3.2、4.6、4.5和2.5个百分点;相比之下,两种以上的混合策略F值提升效果欠佳。在应用人民日报及微博小样本数据集的扩展实验中,单策略简单数据增强改进的提升效果显著:基于多种领域词典混合的实体替换改进策略在两份数据集上F值最高提升6.7个百分点。【局限】在多种策略组合实验中,增强参数α、N调控难度加大,组合策略命名实体识别效果受到影响。【结论】本研究的简单数据增强算法改进策略有效改善了小样本命名实体识别模型效果。 展开更多
关键词 数据增强 简单数据增强 小样本 命名实体识别
原文传递
融合多特征及协同注意力的医学命名实体识别 被引量:1
11
作者 刘歆宁 《计算机工程与应用》 CSCD 北大核心 2024年第6期188-198,共11页
针对当前中文医疗命名实体识别中未融合医学领域文本独有的特征信息导致实体识别准确率无法有效提升的情况,及单注意力机制影响实体分类效果的问题,提出一种基于多特征融合和协同注意力机制的中文医疗命名实体识别方法。利用预训练模型... 针对当前中文医疗命名实体识别中未融合医学领域文本独有的特征信息导致实体识别准确率无法有效提升的情况,及单注意力机制影响实体分类效果的问题,提出一种基于多特征融合和协同注意力机制的中文医疗命名实体识别方法。利用预训练模型得到原始医学文本的向量表示,再利用双向门控循环神经网络(BiGRU)获取字粒度的特征向量。结合医疗领域命名实体鲜明的部首特征,利用迭代膨胀卷积神经网络(IDCNN)提取部首级别的特征向量。使用协同注意力网络(co-attention network)整合特征向量,生成<文字-部首>对的双相关特征,再利用条件随机场(CRF)输出实体识别结果。实验结果表明,在CCKS数据集上,相较于其他的实体识别模型能取得更高的准确率、召回率和F1值,同时虽然增加了识别模型的复杂程度,但性能并没有明显的降低。 展开更多
关键词 中文医学文本 命名实体识别 多特征融合 协同注意力机制 BERT模型
下载PDF
融合卷积门控与实体边界预测的中文财务报表实体抽取研究
12
作者 王婷 杨川 +2 位作者 梁佳莹 向东 邹茂扬 《软件导刊》 2024年第7期25-33,共9页
在金融领域财务报表对企业的发展规划具有重要作用,但提取报表中的有效信息仍然高度依赖于人工。为此,提出一种融合关键信息和实体边界信息的财务报表命名实体识别方法,以提升财务报表有效信息提取效率。首先,通过两个卷积层、自注意力... 在金融领域财务报表对企业的发展规划具有重要作用,但提取报表中的有效信息仍然高度依赖于人工。为此,提出一种融合关键信息和实体边界信息的财务报表命名实体识别方法,以提升财务报表有效信息提取效率。首先,通过两个卷积层、自注意力机制及门控机制组成的卷积门控单元对编码器的输出进行局部特征提取,筛选关键信息来引导实体识别;其次,通过实体边界预测模块将实体边界信息融入具有句子依赖关系的长序列语义特征;最后,将关键信息和融合了实体边界信息的长序列语义特征输入条件随机场层,以提取满足实体标注规则的相邻标签间的依赖,并获得全局最优标签序列。实验表明,所提模型在Resume、MSRA数据集上的F1值分别为95.75%、94.92%,优于所有比较模型,证明了该方法在中文命名实体识别的有效性;在财务报表数据集上的准确率、召回率、F1值分别为87.93%、92.45%、90.13%,相较于基线模型效果更好,能有效识别金融领域命名实体。 展开更多
关键词 金融 命名实体识别 卷积门控单元 实体边界预测 条件随机场
下载PDF
多任务学习的中文电子病历命名实体识别研究 被引量:4
13
作者 余俊康 《软件导刊》 2021年第11期42-46,共5页
中文医疗实体识别是中文电子病历文本信息抽取的关键环节,然而电子病历标注数据较为稀缺,导致在文本信息抽取结果上有一定的局限性。针对中文电子病历标注数据较为稀缺的现状,提出一种具有交叉共享结构的医疗实体命名识别多任务学习模型... 中文医疗实体识别是中文电子病历文本信息抽取的关键环节,然而电子病历标注数据较为稀缺,导致在文本信息抽取结果上有一定的局限性。针对中文电子病历标注数据较为稀缺的现状,提出一种具有交叉共享结构的医疗实体命名识别多任务学习模型,以克服通用深度学习模型需要大量中文电子病历标注数据的困难。将该模型与其他模型在中文电子病历实体识别任务上进行实验比较,基于交叉共享结构的多任务学习模型在CCKS2017和CCKS2018数据集上的精确率分别为90.5%、90.8%。研究表明,基于NEZHA和多任务的医疗命名实体识别模型可以有效地学习多个相关任务的信息,从而提高目标域的识别率。 展开更多
关键词 NEZHA 多任务学习 命名实体识别 中文电子病历 交叉共享结构
下载PDF
面向高校图书馆智慧服务的大语言模型探索性研究——以命名实体识别任务为例
14
作者 刘思得 李东升 《现代情报》 CSSCI 北大核心 2024年第12期102-121,共20页
[目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧... [目的/意义]智慧服务已成为高校图书馆转型发展的重要方向。自然语言处理技术赋能了高校图书馆智慧化服务,带来了服务模式与流程的重构,有助于提升高校图书馆的整体服务水平。命名实体识别是自然语言处理中的一个重要任务,对图书馆智慧化服务产生重要影响和价值,可有效识别信息中的人名、地名、组织机构、资源利用、服务特色和文化推广等实体,为知识组织、信息检索等提供支持。[方法/过程]本文利用命名实体识别技术分析高校图书馆智慧化服务系统的应用前景,通过构建高质量的高校图情语料库,提供高质量训练数据,以满足领域内特定的实体识别需求的准确性和适应性,为优化图书馆智慧服务系统提供基础。采用基于深度学习的ALBERT-BILSTM-CRF模型,用以验证命名实体识别任务的效果,将该模型应用于高校图书馆服务推荐和知识图谱的案例分析,并与现有的国内外主流大语言模型进行了效果比较。[结果/结论]结果表明,本文提出的方法有效地提高了高校图情领域命名实体识别的性能,有助于实现图书馆智慧化服务的推广与应用,同时也减少了资源浪费和训练成本。此外,本文还探讨了服务于图书馆领域大语言模型LibraryGPT的可能性,以便对未来高校图书馆智慧服务的推广和发展提供参考和借鉴。 展开更多
关键词 高校图书馆 智慧服务 命名实体识别 大语言模型
下载PDF
基于BERT的高校图书馆微信信息服务的命名实体识别方法 被引量:3
15
作者 李东升 鲍玉来 +1 位作者 刘建华 陈德旺 《现代情报》 CSSCI 2023年第4期64-76,共13页
[目的/意义]微信服务推文信息的命名实体识别是高校图书馆智慧服务领域的重要研究方向。在目前微信服务推文的命名实体识别领域中,存在高校图书馆微信服务领域的实体名称多样、特征信息提取不明确等问题。[方法/过程]针对以上问题,本文... [目的/意义]微信服务推文信息的命名实体识别是高校图书馆智慧服务领域的重要研究方向。在目前微信服务推文的命名实体识别领域中,存在高校图书馆微信服务领域的实体名称多样、特征信息提取不明确等问题。[方法/过程]针对以上问题,本文通过挖掘高校图书馆服务领域的微信服务推文文本,采用现有知识库和词典规则扩充句子语义信息,并在领域专家的指导下构建了一种高校图书馆微信服务推文文本的命名实体语料集ULICNER,实验数据集包含36035条文本语料数据,7大类16个小类。采用基于BERT-BiLSTM-CRF的模型研究高校图书馆微信推文文本的命名实体识别方法。该模型利用BERT网络将大规模文本生成具有语义特征的字符向量,接着对输入文本序列通过BiLSTM获取文本特征,最后连接CRF获得最佳的序列标记输出。[结果/结论]实验结果表明,本文模型在构建的数据集上取得良好的效果,其F1值为98.75%,准确率值为98.59%,召回率值为98.91%,模型可以运用于高校图书馆信息服务的实体识别任务。 展开更多
关键词 命名实体识别 高校图书馆 微信服务 BERT 双向长短记忆网络 条件随机场
下载PDF
基于BiLSTM-CRF的航行通告命名实体识别研究
16
作者 项恒 杨明友 李猛 《计算机科学》 CSCD 北大核心 2024年第S02期115-120,共6页
针对当前国际民航组织对数字航行通告研究仅考虑对文本航行通告环境兼容,而未考虑对数字航行通告环境兼容的问题,提出一种基于BiLSTM-CRF的航行通告命名实体识别模型,以实现文本航行通告中相关实体的自动识别,并为转换数字航行通告提供... 针对当前国际民航组织对数字航行通告研究仅考虑对文本航行通告环境兼容,而未考虑对数字航行通告环境兼容的问题,提出一种基于BiLSTM-CRF的航行通告命名实体识别模型,以实现文本航行通告中相关实体的自动识别,并为转换数字航行通告提供所需的基本数据。通过构建航行通告语料标记数据集对LSTM,BiLSTM,BiLSTM-CRF 3种模型进行对比实验。实验结果显示,所提模型的精确率、召回率、F 1值分别为95%,95%,95%,验证了其在航行通告领域的有效性,证明本研究可以有效识别航行通告中的重要实体信息。 展开更多
关键词 航行通告 命名实体识别 深度学习 双向长短期记忆网路 条件随机场
下载PDF
基于K-BERT的中文妇产科电子病历实体识别研究
17
作者 张由 李舫 《医学信息》 2024年第1期65-71,共7页
针对利用预训练模型进行中文妇产科电子病历命名实体识别时,BERT缺乏一定的医疗领域专业知识而导致其识别性能下降的问题,提出了一种基于知识图谱的预训练模型——K-BERT的命名实体识别模型K-BERT-BiLSTM-CRF。通过K-BERT预训练模型获... 针对利用预训练模型进行中文妇产科电子病历命名实体识别时,BERT缺乏一定的医疗领域专业知识而导致其识别性能下降的问题,提出了一种基于知识图谱的预训练模型——K-BERT的命名实体识别模型K-BERT-BiLSTM-CRF。通过K-BERT预训练模型获取包含医学背景知识的语义特征向量,利用双向长短时记忆网络(BiLSTM)与条件随机场(CRF)提取上下文相关特征并且解决标签偏移问题,完成实体识别。利用真实妇产科医疗电子病历数据集进行训练,K-BERT-BiLSTM-CRF模型的F1值达到了90.04%。实验表明,相比一般BERT的模型,K-BERT-BiLSTM-CRF命名实体识别模型在中文妇产科电子病历领域上的表现更优异,识别效果更好。 展开更多
关键词 K-BERT 双向长短时记忆网络 条件随机场 妇产科电子病历 命名实体识别
下载PDF
基于BERT-BiLSTM-CRF党建领域命名实体识别
18
作者 赵盾 佘学兵 邬昌兴 《计算机与现代化》 2024年第9期91-94,共4页
党建领域知识图谱构建过程中使用传统的命名实体识别方法时,存在实体边界不清、实体词性多义等问题,导致存在识别准确率和效率低的问题。为此,本文提出一种融合树形概率和领域词典的BERT-BiLSTM-CRF实体识别模型。该模型在BERT中嵌入领... 党建领域知识图谱构建过程中使用传统的命名实体识别方法时,存在实体边界不清、实体词性多义等问题,导致存在识别准确率和效率低的问题。为此,本文提出一种融合树形概率和领域词典的BERT-BiLSTM-CRF实体识别模型。该模型在BERT中嵌入领域词典进行文本向量化表示;利用BiLSTM获取上下文语义特征;将树形概率应用到CRF层的转移概率计算中提高分词准确率。与基准模型在MSRA和自构建的语料库上进行实验对比,实验结果表明本模型在F1值、召回率、精确率3个指标上都能取得较好的效果。 展开更多
关键词 BERT-BiLSTM-CRF模型 树形概率 领域词典 命名实体识别
下载PDF
卫星领域语料库构建与命名实体识别
19
作者 徐聪 石会鹏 +3 位作者 陈志敏 张鑫宇 王静 杨甲森 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第4期175-183,共9页
针对卫星领域命名实体语料匮乏、现有算法识别性能较低的问题,提出一种考虑模糊边界的卫星领域实体标注方法,构建包含8类常见卫星领域实体的语料库,与该领域现有语料库相比粒度更细、覆盖更广,并以此为基础提出迁移学习和多网络融合的... 针对卫星领域命名实体语料匮乏、现有算法识别性能较低的问题,提出一种考虑模糊边界的卫星领域实体标注方法,构建包含8类常见卫星领域实体的语料库,与该领域现有语料库相比粒度更细、覆盖更广,并以此为基础提出迁移学习和多网络融合的卫星领域实体识别算法。该算法采用预训练双向编码器对语料语义平滑迁移获得子词级别特征,采用双向长短期记忆(bi-directional long-short term memory,BiLSTM)神经网络捕捉上下文信息确定边界,以条件随机场作为解码器实现标签预测。实验结果表明:相比于BiLSTM等传统模型具有更优的识别性能,算法在8种实体上的F1值均在92%以上,微平均F1值达到96.10%。 展开更多
关键词 命名实体识别 迁移学习 神经网络 数据稀缺
下载PDF
基于对抗训练的中文电子病历命名实体识别 被引量:3
20
作者 孔令巍 朱艳辉 +4 位作者 张旭 欧阳康 黄雅淋 金书川 沈加锐 《湖南工业大学学报》 2022年第3期36-43,共8页
为提高传统命名实体识别模型在中文电子病历上的准确性,提出一种在基线模型BERTBiLSTM-CRF中加入对抗训练的方法,该方法在词嵌入层添加扰动因子从而生成对抗样本,并利用对抗样本进行迭代训练,从而优化模型参数。CCKS2021评测数据集实验... 为提高传统命名实体识别模型在中文电子病历上的准确性,提出一种在基线模型BERTBiLSTM-CRF中加入对抗训练的方法,该方法在词嵌入层添加扰动因子从而生成对抗样本,并利用对抗样本进行迭代训练,从而优化模型参数。CCKS2021评测数据集实验结果表明,加入FGM和PGD两个对抗训练模型后,其精准率、召回率以及F_(1)值相比于基线模型均有所提升。并且通过对比实验,验证了加入对抗训练能够提高模型的预测能力和鲁棒性。 展开更多
关键词 中文电子病历 命名实体识别 对抗训练 BERT BiLSTM CRF FGM PGD
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部