期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于GRU的命名实体识别方法 被引量:10
1
作者 王洁 张瑞东 吴晨生 《计算机系统应用》 2018年第9期18-24,共7页
命名实体识别是自然语言处理中的一项基础任务,传统的识别方法往往需要外部知识和人工筛选特征,需要较高的人力成本和时间成本;针对传统方法的局限性,提出一种基于GRU(Gated Recurrent Unit)的命名实体识别模型,该模型以字向量作为输入... 命名实体识别是自然语言处理中的一项基础任务,传统的识别方法往往需要外部知识和人工筛选特征,需要较高的人力成本和时间成本;针对传统方法的局限性,提出一种基于GRU(Gated Recurrent Unit)的命名实体识别模型,该模型以字向量作为输入单位,通过双向GRU层提取特征,并通过输出层得到标签序列.在传统命名实体和会议名称这种特定领域命名实体上对该模型进行了测试.实验结果表明,本文设计的循环神经网络模型能有效的识别命名实体,省去了人工设计特征的繁琐工作,提供了一种端到端的识别方法. 展开更多
关键词 命名实体识别 循环神经网络 GRU 会议名称识别
下载PDF
基于语法语义知识的维吾尔文机构名识别 被引量:7
2
作者 麦合甫热提 米日姑.肉孜 +1 位作者 麦热哈巴.艾力 吐尔根.依布拉音 《计算机工程与设计》 CSCD 北大核心 2014年第8期2944-2948,共5页
为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转... 为了提高维吾尔语中机构名的自动识别准确率,从维吾尔语的语言特点出发,对维吾尔语中机构名的组织结构进行了分类并将其形式化表示;根据此特征设计出有效地识别规则,创建了特征词库、地名库和修饰词库等知识库;设计并实现了基于状态转移原理的高效识别算法。实验结果表明,该算法识别的F值达到83.05%,获得了较好结果。 展开更多
关键词 自然语言处理 命名实体识别 机构名识别 知识库 规则匹配
下载PDF
基于条件随机场的维吾尔文机构名识别 被引量:5
3
作者 买合木提.买买提 王路路 +2 位作者 吐尔根.依布拉音 艾山.吾买尔 卡哈尔江.阿比的热西提 《计算机工程与设计》 北大核心 2019年第1期273-278,共6页
为缓解目前维吾尔文机构名识别方法依赖于人工编写规则、识别效率低的问题,提出一种基于条件随机场模型(CRF)的维吾尔文机构名识别方法。根据维吾尔语的语言特性,结合词、词性、音节、机构名特征词表、地名词表等特征,实现维吾尔文机构... 为缓解目前维吾尔文机构名识别方法依赖于人工编写规则、识别效率低的问题,提出一种基于条件随机场模型(CRF)的维吾尔文机构名识别方法。根据维吾尔语的语言特性,结合词、词性、音节、机构名特征词表、地名词表等特征,实现维吾尔文机构名识别。实验结果表明,相比于基于规则的方法和隐马尔科夫模型(HMM),该方法不依赖于人工编写规则,识别的准确率和召回率较高。 展开更多
关键词 命名实体 机构名识别 维吾尔语 条件随机场 黏着语
下载PDF
基于膨胀卷积迭代与注意力机制的实体名识别方法 被引量:4
4
作者 吕江海 杜军平 +1 位作者 周南 薛哲 《计算机工程》 CAS CSCD 北大核心 2021年第1期58-65,71,共9页
针对传统实体名识别方法无法兼顾文本序列提取特征的有效性和神经网络模型训练速度的问题,提出一种基于迭代膨胀卷积神经网络(IDCNN)与注意力机制(ATT)的实体名识别方法。IDCNN可利用GPU并行计算的优化能力,保留长短期记忆神经网络的特... 针对传统实体名识别方法无法兼顾文本序列提取特征的有效性和神经网络模型训练速度的问题,提出一种基于迭代膨胀卷积神经网络(IDCNN)与注意力机制(ATT)的实体名识别方法。IDCNN可利用GPU并行计算的优化能力,保留长短期记忆神经网络的特性,即用简单的结构记录尽可能多的输入信息,并在准确提取文本序列特征的同时加快神经网络模型的训练速度。通过引入ATT运用文本语法信息和单词词性信息,从众多文本特征中选择对实体名识别更关键的特征,从而提高文本特征提取的准确性。在新闻数据集和微博数据集上的实验结果表明,神经网络模型的训练速度比传统的双向长短期记忆神经网络有显著提升,基于注意力的实体名识别方法的评价指标比传统的无注意力机制方法提高2%左右。 展开更多
关键词 实体名识别 注意力机制 膨胀卷积 长短期记忆网络 条件随机场
下载PDF
基于自然语言处理的压缩机故障自动识别方法
5
作者 朱江 陈涛 +3 位作者 李鹤喜 何振威 曾昭德 浦汉军 《五邑大学学报(自然科学版)》 CAS 2020年第4期42-46,共5页
压缩机工单记录文档记录了压缩机故障信息和相应解决方案.本文尝试利用自然语言处理技术对压缩机工单记录文档进行分析,自动识别出其中的设备实体和故障描述信息.首先,从工单记录文档中分离并人工标注出设备信息和故障信息,构建设备实... 压缩机工单记录文档记录了压缩机故障信息和相应解决方案.本文尝试利用自然语言处理技术对压缩机工单记录文档进行分析,自动识别出其中的设备实体和故障描述信息.首先,从工单记录文档中分离并人工标注出设备信息和故障信息,构建设备实体数据集和故障描述数据集.然后,在BERT预处理模型的基础上进行序列标注模型的微调,分别构建压缩机设备名称自动识别模型和故障描述自动识别模型.在设备实体数据集和故障描述数据集上的实验结果显示:上述模型对压缩机设备实体和故障描述的自动识别F1值分别达到了95.05%和74.44%,超出业界普遍使用的BiLSTM+CRF模型9.71%和16.85%,验证了方法的有效性. 展开更多
关键词 压缩机 故障识别 命名实体识别 预训练模型 自然语言处理
下载PDF
基于层叠条件随机场模型的中文机构名自动识别 被引量:112
6
作者 周俊生 戴新宇 +1 位作者 尹存燕 陈家骏 《电子学报》 EI CAS CSCD 北大核心 2006年第5期804-809,共6页
中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高... 中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法. 展开更多
关键词 命名实体 中文机构名识别 条件随机场
下载PDF
基于条件随机场的中文人名识别研究 被引量:3
7
作者 邱莎 段玻 +1 位作者 申浩如 丁海燕 《昆明学院学报》 2011年第6期64-66,共3页
利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计... 利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计中文人名在文本中的条件概率分布,获得模型参数,并采用序列标注的方式完成中文人名识别任务.多次闭合测试和开放测试结果表明,F值基本都高于90%. 展开更多
关键词 命名实体识别 中文人名识别 条件随机场 条件概率 特征模板 序列标注
下载PDF
一种基于位置概率模型的中文人名识别方法 被引量:1
8
作者 孟伟涛 张蕾 +1 位作者 张晓孪 李海军 《计算机应用与软件》 CSCD 北大核心 2008年第4期187-189,共3页
提出了一种基于位置概率模型的中文人名识别算法。系统的知识源来自于两个方面:人名列表以及标注语料库中提取的人名的左右边界词语。识别过程是:首先根据位置概率模型识别出篇章中可能的人名,然后扩散到整个篇章来召回遗漏人名,最后附... 提出了一种基于位置概率模型的中文人名识别算法。系统的知识源来自于两个方面:人名列表以及标注语料库中提取的人名的左右边界词语。识别过程是:首先根据位置概率模型识别出篇章中可能的人名,然后扩散到整个篇章来召回遗漏人名,最后附加几条启发式规则来对结果进行修正。对40篇新闻语料共计120KB进行开放测试,准确率达80.5%,召回率为76.1%。 展开更多
关键词 命名实体识别 人名识别 位置概率模型 词法分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部