-
题名结合近邻分析的小样本命名实体识别方法
- 1
-
-
作者
江汀莹
线岩团
王红斌
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《现代电子技术》
2023年第19期88-94,共7页
-
基金
国家自然科学基金资助项目(62266028)
云南省重大科技专项计划项目课题(202202AD080003⁃02)。
-
文摘
小样本命名实体识别通过少量标注样本构建可应用于未知类别的实体识别模型,是命名实体识别的新兴研究方向。小样本实体识别具有实体边界检测不准确以及训练数据数量少、可见实体类别少的特点,导致模型性能表现不佳,模型极易过拟合。针对这个问题,提出结合近邻分析的小样本命名实体识别方法,将命名实体识别任务分成实体范围检测和实体类别预测两部分完成,其中实体范围检测部分使用片段打分的方法,实体类别预测部分使用近邻分析的方法。此外,为了缓解训练数据少带来的模型过拟合问题,还在实体特征的隐空间上进行Mixup数据增强以扩增伪样本。实验结果表明,所提出的结合近邻分析的小样本命名实体识别方法有效地提高了小样本实体识别的性能。
-
关键词
小样本
实体识别
实体分类
过拟合
近邻分析算法
数据增强
泛化性能
深度神经网络
-
Keywords
few shot
entity recognition
entity classification
overfitting
NCA algorithm
data enhancement
generalization performance
deep neutral network
-
分类号
TN911.1-34
[电子电信—通信与信息系统]
TP391.1
[电子电信—信息与通信工程]
-