-
题名面向国防科技领域的技术和术语识别方法研究
被引量:12
- 1
-
-
作者
冯鸾鸾
李军辉
李培峰
朱巧明
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息技术处理重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2019年第12期231-236,共6页
-
基金
国家自然基金项目重点项目(61836007),面上项目(61772354,61773276)资助
-
文摘
随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础。文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi-LSTM+CRF模型上的应用。此外,针对任务的特点,提出了适用于技术和术语识别的语言学特征。基于该领域的语料库,实验结果表明技术和术语识别的F1值达到了71.80%,较基准系统提升了3.04%,能够较好地识别出面向国防科技领域的技术和术语。同时,所提方法也优于基于BERT模型的技术术语识别方法。
-
关键词
面向国防科技领域
技术和术语
子词
bi-lstm+crf模型
语言学特征
-
Keywords
Oriented national defense science
Technology and terminology
Subwords
bi-lstm+crf model
Linguistic features
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名采用BI-LSTM-CRF模型的数值信息抽取
被引量:10
- 2
-
-
作者
王竣平
白宇
蔡东风
-
机构
沈阳航空航天大学人机智能研究中心
辽宁省知识工程与人机交互工程技术研究中心
-
出处
《计算机应用与软件》
北大核心
2019年第5期138-144,共7页
-
基金
教育部人文社会科学研究项目(17YJCZH003)
辽宁省自然科学基金项目(20170540696)
沈阳市科技计划项目(17-231-1-82)
-
文摘
数值信息是文本中的一种重要信息,含有主体、属性、属性值等元素。然而当前数值信息抽取方法对比较关系的表示比较单一,对于含有多个数值的句子,其数值信息抽取的效果不佳。根据文本中数量关系表述特征,提出一种数值信息表示方法和数值信息抽取框架。根据数值信息中各个元素的特点,利用BI-LSTM-CRF模型对数值信息元素进行识别;利用语言特征判断属性值和其他元素之间的语义关系。该方法对数值信息抽取的准确率、召回率和F值分别达到0.775、0.752和0.763,优于现有的抽取的方法。
-
关键词
数值信息表示
语义关系
bi-lstm-crf模型
-
Keywords
Numerical information representation
Semantic relationship
bi-lstm-crf model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名融入注意力机制的越南语组块识别方法
被引量:1
- 3
-
-
作者
王闻慧
毕玉德
雷树杰
-
机构
信息工程大学洛阳校区
复旦大学外国语言文学学院
-
出处
《中文信息学报》
CSCD
北大核心
2019年第12期91-100,共10页
-
文摘
对于越南语组块识别任务,在前期对越南语组块内部词性构成模式进行统计调查的基础上,该文针对Bi-LSTM+CRF模型提出了两种融入注意力机制的方法:一是在输入层融入注意力机制,从而使得模型能够灵活调整输入的词向量与词性特征向量各自的权重;二是在Bi-LSTM之上加入了多头注意力机制,从而使模型能够学习到Bi-LSTM输出值的权重矩阵,进而有选择地聚焦于重要信息。实验结果表明,在输入层融入注意力机制后,模型对组块识别的F值提升了3.08%,在Bi-LSTM之上加入了多头注意力机制之后,模型对组块识别的F值提升了4.56%,证明了这两种方法的有效性。
-
关键词
越南语
组块识别
bi-lstm+crf模型
注意力机制
-
Keywords
Vietnamese
chunk identification
bi-lstm+crf model
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-