期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于BiLSTM-CRF的政府微博舆论观点抽取与焦点呈现 被引量:12
1
作者 胡吉明 郑翔 +1 位作者 程齐凯 张岩 《情报理论与实践》 CSSCI 北大核心 2021年第1期174-179,137,共7页
[目的/意义]准确把握公众微博评论中所反映的公众观点并总结舆论焦点,有助于及时获取和引导社会舆情态势,对政府公信力、快速响应能力及执行力提升具有支撑作用。[方法/过程]文章针对当前政府微博评论社会功能发挥的现实要求和其文本特... [目的/意义]准确把握公众微博评论中所反映的公众观点并总结舆论焦点,有助于及时获取和引导社会舆情态势,对政府公信力、快速响应能力及执行力提升具有支撑作用。[方法/过程]文章针对当前政府微博评论社会功能发挥的现实要求和其文本特征挖掘的技术需求,从基于深度学习的文本智能语义理解和挖掘出发,提出了适用的细粒度四元组标注策略,构建了政府微博评论观点抽取与焦点呈现的深度学习模型POF-BiLSTM-CRF,即通过细粒度标注策略确定、Word2vec训练词向量、BiLSTM评论特征学习进行标签及其概率输出、CRF学习上下文实现微博评论标注优化,以及观点聚类和主题词提取后最终呈现舆论焦点。[结果/结论]针对"中国警方在线"微博评论的实验表明,文章所提研究框架和模型能够有效进行舆论观点的智能化提取,为快速把握公众观点及为政府决策提供了参考。 展开更多
关键词 政府微博评论 舆论观点抽取 深度学习模型 bilstm-crf模型 POF-bilstm-crf模型
原文传递
基于BiLSTM-CRF的中医医案命名实体识别 被引量:10
2
作者 羊艳玲 李燕 +1 位作者 钟昕妤 徐丽娜 《中医药信息》 2021年第11期15-21,共7页
目的:针对中医医案中分词困难及实体种类繁多、歧义等难点,提出基于双向长短期记忆(BiLSTM)网络和条件随机场(CRF)的深度学习混合模型命名实体识别方法。方法:基于人工标注的名老中医诊断高血压医案构建BiLSTM-CRF模型进行命名实体识别... 目的:针对中医医案中分词困难及实体种类繁多、歧义等难点,提出基于双向长短期记忆(BiLSTM)网络和条件随机场(CRF)的深度学习混合模型命名实体识别方法。方法:基于人工标注的名老中医诊断高血压医案构建BiLSTM-CRF模型进行命名实体识别,根据深度学习模型特点,该模型使用BiLSTM作为特征提取器,使用CRF进行序列标注,通过对语料集进行标注,对医案中疾病、症状、证候、治法和处方五类实体进行命名实体类别识别。结果:对整理的435份医案进行序列标注,基于向量构建从而进行命名实体类别识别。经过增加轮次后,综合测试实验结果精确率为81.3%,准确率达到90.13%;在各类别识别中,疾病精确率为73.87%,症状精确率为75.93%,证候精确率为72.33%,治法精确率为68.13%,处方精确率最高达到89.15%。结论:利用BiLSTM-CRF模型能够有效实现中医医案命名实体类别识别,有效提高了中医医案的实体识别准确率,为临床诊断提供有效数据支持。 展开更多
关键词 bilstm-crf模型 命名实体识别 中医医案 信息抽取
下载PDF
面向深度学习网络的细粒度商品评价分析 被引量:8
3
作者 康月 薛惠珍 华斌 《计算机工程与应用》 CSCD 北大核心 2021年第11期140-147,共8页
利用BERT预训练模型的优势,将句法特征与BERT词嵌入模型融入到深度学习网络中,实现细粒度的商品评价分析。提出一种基于深度学习的两阶段细粒度商品评价情感分析模型,利用融合句法特征与BERT词嵌入的BILSTM-CRF注意力机制模型提取用户... 利用BERT预训练模型的优势,将句法特征与BERT词嵌入模型融入到深度学习网络中,实现细粒度的商品评价分析。提出一种基于深度学习的两阶段细粒度商品评价情感分析模型,利用融合句法特征与BERT词嵌入的BILSTM-CRF注意力机制模型提取用户评论中的商品实体、属性与情感词;运用BILSTM模型对提取的结果进行情感分析。在SemEval-2016 Task 5和COAE Task3商品评价数据集上的特征提取F1值达到88.2%,分别高出BILSTM模型、BILSTM-CRF模型4.8个百分点、2.3个百分点;情感分类精度达到88.5%,比普通的RNN高出8个百分点,比支持向量机、朴素贝叶斯等传统机器学习方法高出15个百分点。通过模型的复杂度分析,进一步证明融合句法特征与BERT词嵌入后的深度学习模型,在细粒度商品评价情感分析上的优势。 展开更多
关键词 情感分析 深度学习 bilstm-crf模型 BERT 注意力机制
下载PDF
基于深度学习的中共党史文献命名实体识别研究 被引量:6
4
作者 曹树金 岳文玉 《情报资料工作》 CSSCI 北大核心 2022年第5期81-88,共8页
[目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑。[方法/... [目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑。[方法/过程]本研究采用基于Trie树的字符串匹配算法完成实验语料的批量标注任务,利用中文XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)预训练模型嵌入主流BiLSTM-CRF模型中,构建基于XLNet-BiLSTM-CRF的中共党史文献命名实体识别模型。[结果/结论]该模型在命名实体识别中表现优异,其调和平均数F值为0.9535,高于BiLSTM-CRF、BERT-BiLSTM-CRF、BERT-wwmext-BiLSTM-CRF、XLNet-CRF等深度学习模型。研究表明本文提出的方法对于中共党史非结构化文本挖掘工作具有可行性和有效性。 展开更多
关键词 深度学习 中共党史文献 命名实体识别 XLNet模型 bilstm-crf模型
原文传递
基于结构功能和实体识别的文本语义表示——以病历领域为例 被引量:5
5
作者 胡吉明 钱玮 +1 位作者 文鹏 吕晓光 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第8期110-121,共12页
【目的】融合中文病历的结构功能信息,丰富病历文本的语义内涵,提升文本表示的准确性和后续文本挖掘效果。【方法】依据中文病历结构功能特征,创新文本语义表示策略,使用BiLSTM-CRF模型实现基于结构的命名实体智能识别,在词向量层面引... 【目的】融合中文病历的结构功能信息,丰富病历文本的语义内涵,提升文本表示的准确性和后续文本挖掘效果。【方法】依据中文病历结构功能特征,创新文本语义表示策略,使用BiLSTM-CRF模型实现基于结构的命名实体智能识别,在词向量层面引入实体及结构信息,经由TextCNN模型进一步提取局部上下文特征,得到文本语义内涵更为丰富的向量表示形式。【结果】在命名实体识别实验中,基于结构的医疗实体识别精确率、召回率和F值分别达93.20%、95.19%和94.19%;在文本表示的分类验证实验中,所提病历文本表示方法的分类准确率达到92.12%。【局限】需进一步加强对更多类型文本的验证,细化结构识别过程,使所提方法更好地应用于文本挖掘工作。【结论】本文将病历结构功能信息引入病历文本表示工作,实验证明了其既能有效提高命名实体识别准确度,又能进一步丰富文本语义内涵和提升文本表示效果。 展开更多
关键词 中文病历 文本结构功能 命名实体识别 文本语义表示 bilstm-crf模型
原文传递
结合信息量和深度学习的领域新词发现 被引量:6
6
作者 黄文明 杨柳青青 任冲 《计算机工程与设计》 北大核心 2019年第7期1903-1907,1914,共6页
针对传统的新词发现中,数据的稀疏性使一些低频新词无法识别等问题,提出一种对分词结果计算信息量且将深度学习模型BiLstm-CRF用于新词发现的方法,计算出的信息量用以表示词语内部粘合度和分离度,并加入人工规则进行过滤。BiLstm-CRF模... 针对传统的新词发现中,数据的稀疏性使一些低频新词无法识别等问题,提出一种对分词结果计算信息量且将深度学习模型BiLstm-CRF用于新词发现的方法,计算出的信息量用以表示词语内部粘合度和分离度,并加入人工规则进行过滤。BiLstm-CRF模型精度高,对词向量的依赖小,考虑到上下文信息。信息量和模型两部分的结合解决了大量人工序列标注问题,提高了低频新词的识别率。实验结果表明,该方法能有效提高了新词识别的准确率。 展开更多
关键词 新词发现 信息量 粘合度 分离度 bilstm-crf模型
下载PDF
基于RoBERTa-BiLSTM-CRF的简历实体识别 被引量:2
7
作者 刘慧敏 熊菲 王国庆 《电脑知识与技术》 2023年第4期14-17,共4页
命名实体识别是自然语言处理中一个重要的研究领域,也是诸多自然语言下游任务的一个前置研究。针对简历实体识别任务,提出了一种基于RoBERTa-BiLSTM-CRF模型的解决方案。首先使用RoBERTa预训练语言模型对输入的简历语句进行切分,得到字... 命名实体识别是自然语言处理中一个重要的研究领域,也是诸多自然语言下游任务的一个前置研究。针对简历实体识别任务,提出了一种基于RoBERTa-BiLSTM-CRF模型的解决方案。首先使用RoBERTa预训练语言模型对输入的简历语句进行切分,得到字词的上下文信息并对词的语义向量进行表征,然后将得到的词向量输入BiLSTM-CRF模型进行训练。实验结果表明,该模型可以高效且准确地将简历中预先设定的实体进行抽取,可以极大地提升相关从业者的工作效率。 展开更多
关键词 简历实体识别 RoBERTa模型 词向量 bilstm-crf模型
下载PDF
基于双向LSTM与CRF融合模型的否定聚焦点识别 被引量:4
8
作者 沈龙骧 邹博伟 +2 位作者 叶静 周国栋 朱巧明 《中文信息学报》 CSCD 北大核心 2019年第1期25-34,共10页
否定表达作为自然语言文本中常见的语言现象,对自然语言处理上层应用,如情感分析、信息抽取等,具有十分重要的意义。否定聚焦点识别任务是更细粒度的否定语义分析,其旨在识别出句子中被否定词修饰和强调的文本片段。该文将该任务作为序... 否定表达作为自然语言文本中常见的语言现象,对自然语言处理上层应用,如情感分析、信息抽取等,具有十分重要的意义。否定聚焦点识别任务是更细粒度的否定语义分析,其旨在识别出句子中被否定词修饰和强调的文本片段。该文将该任务作为序列标注问题,提出了一种基于双向长短期记忆网络结合条件随机场(BiLSTMCRF)的否定聚焦点识别模型,其中,BiLSTM网络能够充分利用上下文信息并抓取全局特征,CRF层能够有效学习输出标签之间的前后依赖关系。在*SEM2012评测任务数据集上的实验结果表明,基于BiLSTM-CRF的否定聚焦点识别方法的准确率(accuracy)达到69.58%,与目前最好的系统相比,性能提升了2.44%。 展开更多
关键词 否定聚焦点 bilstm-crf模型 序列标注
下载PDF
徽派建筑知识图谱的半自动化构建 被引量:2
9
作者 张润梅 杨超 +1 位作者 尹蕾 张媛 《安徽建筑大学学报》 2021年第5期13-19,共7页
本文针对徽派建筑数据异构多源和非结构化的特点,提出一种BiLSTM-CRF模型与徽派建筑词典相结合的命名实体识别方法,利用先验知识的辅助作用,提升实体识别效果,完成对建筑实体进行的识别抽取。利用Neo4j图数据库存储知识,用属性图模型表... 本文针对徽派建筑数据异构多源和非结构化的特点,提出一种BiLSTM-CRF模型与徽派建筑词典相结合的命名实体识别方法,利用先验知识的辅助作用,提升实体识别效果,完成对建筑实体进行的识别抽取。利用Neo4j图数据库存储知识,用属性图模型表示知识。最后使用Neo4j图数据库对构建的徽派建筑知识图谱进行了可视化展示。研究结果表明,此方法能够有效地构建徽派建筑领域知识图谱,为今后徽派建筑知识智能化推荐和搜索系统研究奠定基础。 展开更多
关键词 徽派建筑 知识图谱 图数据库 bilstm-crf模型 Neo4j
下载PDF
基于BERT-BiLSTM-CRF模型的电子目标图谱实体抽取方法
10
作者 付美玲 薛磊 徐英 《空天预警研究学报》 2022年第3期206-210,216,共6页
针对电子目标情报数据种类繁多、关联关系复杂,电子目标图谱存在实体抽取混乱、语义容易发生歧义等问题,将BiLSTM-CRF模型和BERT模型相结合,提出了一种电子目标图谱实体抽取方法.该方法将BERT模型中训练的词向量传递给BiLSTM模型中做特... 针对电子目标情报数据种类繁多、关联关系复杂,电子目标图谱存在实体抽取混乱、语义容易发生歧义等问题,将BiLSTM-CRF模型和BERT模型相结合,提出了一种电子目标图谱实体抽取方法.该方法将BERT模型中训练的词向量传递给BiLSTM模型中做特征;然后在CRF模型中得到全局序列排列,实现电子目标图谱的实体抽取.实验结果表明,与Word2Vec和BERT不同字嵌入相比,BERT的字嵌入平均识别率提高3.22%;与BiLSTM、CRF、BiLSTM等不同模型层次相比,BERT-BiLSTM-CRF的平均识别率比其他3种模型最好的平均值还要高2.99%,说明该方法能够进一步提高电子目标相关命名实体识别的效果. 展开更多
关键词 知识图谱 知识抽取 电子目标 bilstm-crf模型
下载PDF
汉语否定与不确定覆盖域检测
11
作者 叶静 邹博伟 +3 位作者 洪宇 沈龙骧 朱巧明 周国栋 《计算机研究与发展》 EI CSCD 北大核心 2019年第7期1506-1516,共11页
自然语言文本中存在大量否定和不确定表述,识别这些信息并将其与确定性内容分离,对自然语言处理的下游应用,如信息抽取、信息检索、情感分析等,都具有十分重要的意义.与英语相比,面向汉语的否定与不确定覆盖域检测研究目前较为匮乏.提... 自然语言文本中存在大量否定和不确定表述,识别这些信息并将其与确定性内容分离,对自然语言处理的下游应用,如信息抽取、信息检索、情感分析等,都具有十分重要的意义.与英语相比,面向汉语的否定与不确定覆盖域检测研究目前较为匮乏.提出了一个基于双向长短期记忆(bidirectional long short-term memory, BiLSTM)网络和条件随机场(conditional random fields, CRF)的融合模型,将覆盖域检测任务作为序列标注问题,针对给定的否定或不确定关键词,识别其在句子中的语义作用范围.该模型既具有LSTM(long short-term memory)网络能够利用前向与后向上下文信息的特性,同时又能够借助CRF 层获取输出标签之间的依赖关系,这得益于该框架能够有效地对序列信息及长距离上下文依赖信息进行编码的优势.在CNeSp语料集上的实验结果验证了模型的有效性,其中,在金融新闻子数据集上,否定与不确定覆盖域检测准确率分别达到79.16%和76.79%,比目前基于传统机器学习的汉语覆盖域检测方法分别提升了25.06%和34.46%. 展开更多
关键词 否定 不确定 覆盖域检测 bilstm-crf模型 序列标注
下载PDF
地理信息服务领域的实体自动化识别 被引量:1
12
作者 独凌子 肖桂荣 《海南大学学报(自然科学版)》 CAS 2021年第4期331-339,共9页
针对地理信息服务领域(Geographic Information Services,GIServices)在实体自动识别方面存在缺乏语料、多种实体嵌套、语义稀疏等问题,本文设计了一套地理信息服务文献实体标注规范,构建了地理信息服务领域的语料;在传统实体识别模型Bi... 针对地理信息服务领域(Geographic Information Services,GIServices)在实体自动识别方面存在缺乏语料、多种实体嵌套、语义稀疏等问题,本文设计了一套地理信息服务文献实体标注规范,构建了地理信息服务领域的语料;在传统实体识别模型BiLSTM-CRF的基础上,引入了BERT(Bidirectional Encoder Representaions from Transformers)预训练模型及卷积层(Convolutional layer),构建了BERT-1DCNN-BiLSTM-CRF模型,提升了地理信息服务文献实体识别的准确率.该模型在词嵌入层以BERT预训练模型取代了传统的静态语言模型,从而有效地解决了地理信息服务领域因缺乏大量训练语料而无法表达更丰富句子语义信息的问题;此外,在BERT模型之后还加入了字间卷积特征,提升了句子局部特征的表示能力,降低了句子语义稀疏的干扰.实验结果表明,融合了BERT模型与CNN模型的GIServices文献实体识别方法效果优于传统深度学习的方法,模型准确率达到了0.8268,能够较好地实现GIServices文献自动化实体识别,同时也能较好地体现基于BERT的深度学习模型在实体自动化识别方面的有效性. 展开更多
关键词 地理信息服务 BERT模型 命名实体识别 字间特征卷积 bilstm-crf模型
下载PDF
基于BILSTM_CRF的知识图谱实体抽取方法 被引量:23
13
作者 翟社平 段宏宇 李兆兆 《计算机应用与软件》 北大核心 2019年第5期269-274,280,共7页
针对传统知识图谱实体抽取方法需要大量人工特征和专家知识的问题,提出一种基于BILSTM_CRF模型的神经网络结构实体抽取方法。它既能使用双向长短时记忆网络BILSTM(Bidirectional Long Short-Term Memory)提取文本信息的特征,又可利用条... 针对传统知识图谱实体抽取方法需要大量人工特征和专家知识的问题,提出一种基于BILSTM_CRF模型的神经网络结构实体抽取方法。它既能使用双向长短时记忆网络BILSTM(Bidirectional Long Short-Term Memory)提取文本信息的特征,又可利用条件随机场CRF(Conditional Random Fields)衡量序列标注的联系。该方法对输入的文本进行建模,把句子中的每个词转换为词向量;利用BILSTM处理分布式向量得到句子特征;使用CRF标注并抽取实体,得到最终结果。实验结果表明,该方法的准确率和召回率更高,F1值提升约8%,具有更强的适用性。 展开更多
关键词 知识图谱 实体抽取 神经网络 词向量 bilstm_crf模型
下载PDF
基于BERT-BiLSTM-CRF模型的地理实体命名实体识别 被引量:7
14
作者 汤洁仪 李大军 刘波 《北京测绘》 2023年第2期143-147,共5页
互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学... 互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学习模型BERT-BiLSTM-CRF模型对自建的地理实体语料库进行了命名实体识别(NER),模型在传统的BiLSTM-CRF模型上加入了BERT预训练模型,使得模型可以更好地结合文本上下文及语义信息。结果表明,该模型相比于BiLSTM-CRF模型和BiLSTM模型在地理实体命名实体识别中取得了更好的结果,且对进一步构建地理实体知识图谱、知识库等具有重要意义。 展开更多
关键词 地理实体 命名实体识别(NER) 知识抽取 BERT-bilstm-crf模型
下载PDF
基于BERT-BiLSTM-CRF模型的油气领域命名实体识别 被引量:2
15
作者 高国忠 李宇 +1 位作者 华远鹏 吴文旷 《长江大学学报(自然科学版)》 2024年第1期57-65,共9页
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from... 针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields,CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F_(1)值分别达到91.3%、94.5%和92.9%,实体识别效果优于其他2种模型。 展开更多
关键词 油气领域 命名实体识别 BERT 双向长短期记忆网络 条件随机场 BERT-bilstm-crf模型
下载PDF
基于BERT-BiLSTM-CRF党建领域命名实体识别
16
作者 赵盾 佘学兵 邬昌兴 《计算机与现代化》 2024年第9期91-94,共4页
党建领域知识图谱构建过程中使用传统的命名实体识别方法时,存在实体边界不清、实体词性多义等问题,导致存在识别准确率和效率低的问题。为此,本文提出一种融合树形概率和领域词典的BERT-BiLSTM-CRF实体识别模型。该模型在BERT中嵌入领... 党建领域知识图谱构建过程中使用传统的命名实体识别方法时,存在实体边界不清、实体词性多义等问题,导致存在识别准确率和效率低的问题。为此,本文提出一种融合树形概率和领域词典的BERT-BiLSTM-CRF实体识别模型。该模型在BERT中嵌入领域词典进行文本向量化表示;利用BiLSTM获取上下文语义特征;将树形概率应用到CRF层的转移概率计算中提高分词准确率。与基准模型在MSRA和自构建的语料库上进行实验对比,实验结果表明本模型在F1值、召回率、精确率3个指标上都能取得较好的效果。 展开更多
关键词 BERT-bilstm-crf模型 树形概率 领域词典 命名实体识别
下载PDF
基于BERT的命名实体识别
17
作者 赵英明 王浩森 赵明瞻 《河北建筑工程学院学报》 CAS 2024年第1期253-257,共5页
在中文命名实体识别任务中,将字向量化表示是重要的步骤,然而传统的词向量表示方法只能将字映射为单一向量,无法表征字的多义性。对此引入了BERT预训练语言模型,BERT模型可以增强字的语义表示,根据其上下文动态生成语义向量。而针对BER... 在中文命名实体识别任务中,将字向量化表示是重要的步骤,然而传统的词向量表示方法只能将字映射为单一向量,无法表征字的多义性。对此引入了BERT预训练语言模型,BERT模型可以增强字的语义表示,根据其上下文动态生成语义向量。而针对BERT微调训练对计算机性能要求较高的问题,采用了固定参数嵌入的方式对BERT进行应用,并搭建了BERT-BiLSTM-CRF模型。实验结果表明,基于BERT的命名实体识别模型在MSRA数据集上的F1-Score指标达到94.48%。优于传统机器学习模型和其他基于深度学习模型的方法。研究结果表明,BERT模型在命名实体识别任务中具有很好的应用前景。 展开更多
关键词 命名实体识别 BERT 微调 BERT-bilstm-crf模型 深度学习
下载PDF
面向技术识别的专利实体抽取--以类脑智能领域为例
18
作者 邢晓昭 苑朋彬 +2 位作者 陈亮 任亮 余池 《情报杂志》 北大核心 2024年第6期126-133,144,共9页
[研究目的]专利实体抽取是基于专利文本的技术识别的基础。目前专利实体抽取任务面临自动化程度和准确率较低等问题,该研究从两方面对此进行改进:一是建立特定领域的高质量专利语料库,二是将先进的算法模型运用到专利实体抽取中。[研究... [研究目的]专利实体抽取是基于专利文本的技术识别的基础。目前专利实体抽取任务面临自动化程度和准确率较低等问题,该研究从两方面对此进行改进:一是建立特定领域的高质量专利语料库,二是将先进的算法模型运用到专利实体抽取中。[研究方法]定义了包含13种实体类型的细粒度信息体系,并据此对921篇类脑智能专利的标题和摘要进行人工标注,此后运用Bert-BiLSTM-CRF模型,融合深度学习和机器学习对类脑智能专利实体进行识别。[研究结论]模型在总体上获得0.8的准确率、召回率和F1值,不同类型实体的识别效果具有差异。为了验证模型的性能,设计了几个对比实验。结果显示,微调数据和增加训练规模可以提高模型性能,本模型性能优于同时期一些经典模型。 展开更多
关键词 专利实体 专利文本 专利挖掘 技术识别 深度学习 机器学习 Bert-bilstm-crf模型
下载PDF
基于藏文音节结合BiLSTM-CRF的藏语语义组块分类标注
19
作者 旦正吉 华却才让 +1 位作者 完么措 白颖 《高原科学研究》 CSCD 2024年第2期118-125,共8页
针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLST... 针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLSTM-CRF方法训练了藏语语义组块识别和分类模型。综合测试实验结果表明,该模型精确率为75.03%,召回率为76.52%,F1值为75.77%。各类语义组块识别中,指示类(INS)识别的测评结果远高于其他几类语义组块,精确率为90.87%;组织类(ORG)的测评结果偏低于其他类型,精确率为66.67%。文章研究证实了TS-BiLSTM-CRF模型在藏语语义组块识别分析任务中具有较好的性能。 展开更多
关键词 藏语 语义组块识别 TS-bilstm-crf模型 标注规范
下载PDF
基于命名实体识别的施工限速命令关键信息提取及应用
20
作者 曹文斌 赵飞 郭占清 《中国铁路》 北大核心 2024年第3期57-63,共7页
调度命令是铁路运输调度指挥的核心,是对行车工作、作业方式和安全注意事项进行约束的必要手段。施工限速命令的内容是纯文本形式或半结构化形式,人工解析工作量大、效率低下,对命令进行信息整合和内容分析存在不足。构建BERT、BiLSTM和... 调度命令是铁路运输调度指挥的核心,是对行车工作、作业方式和安全注意事项进行约束的必要手段。施工限速命令的内容是纯文本形式或半结构化形式,人工解析工作量大、效率低下,对命令进行信息整合和内容分析存在不足。构建BERT、BiLSTM和CRF模型,对施工限速命令的非结构化内容进行命名实体识别,提取命令内容的关键信息,实现命令的信息整合与分析。以施工限速命令中“邻线限速命令”为例对模型进行试验,在实体识别结果的基础上对限速命令内容进行分析,推算出列车限速的里程范围以及受影响的列车数量,可有效分析施工对邻线的影响程度。应用结果表明:基于BERT-BiLSTM-CRF模型的命名实体识别,为命令内容分析提供了强有力的数据支持,为铁路运输调度管理提供了指挥和决策辅助。 展开更多
关键词 调度命令 施工限速命令 命名实体识别 BERT-bilstm-crf模型 关键信息提取
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部