-
题名一种结合词汇信息特征的中文命名实体识别方法
- 1
-
-
作者
闫河
李尧
雷秋霞
王旭
-
机构
重庆理工大学两江人工智能学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第7期1622-1628,共7页
-
基金
国家自然科学基金面上项目(61173184)资助
重庆市自然科学基金项目(cstc2018jcyjAX0694)资助.
-
文摘
在中文命名实体识别任务中,基于字符级嵌入的模型通常仅采用BiLSTM网络获取序列中字符的上下文特征进行实体识别,并没有考虑到词汇信息特征能够在识别实体边界时提供更优的约束.针对此问题,该文提出了一种结合词汇信息特征的中文命名实体识别方法.首先,采用带有残差连接的门控空洞卷积网络提取序列局部特征来表示词汇信息特征,以及采用BiGRU提取序列全局上下文信息特征,并添加句子级注意力机制来增强网络的长序列建模能力;其次,利用稀疏注意力机制对特征进行动态融合,获得包含词汇信息的文本特征;最后,运用CRF学习序列中的约束条件,得到最佳的实体标注结果.对比实验结果表明,该文方法在Resume和CLUENER2020数据集上优于主流的中文命名实体识别方法.
-
关键词
中文命名实体识别
门控空洞卷积
稀疏注意力机制
词汇信息特征
-
Keywords
Chinese named entity recognition
gated-dilated convolutional
sparse attention mechanism
lexical information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-