-
题名基于残差注意网络的端到端手写文本识别方法
- 1
-
-
作者
王寅同
郑豪
常合友
李朔
-
机构
南京晓庄学院信息工程学院
浙江大学计算机科学与技术学院
英国德蒙福特大学人工智能研究所
-
出处
《控制与决策》
EI
CSCD
北大核心
2023年第7期1825-1834,共10页
-
基金
国家自然科学基金项目(62177028,61976118,61806098)
江苏省自然科学基金项目(BK20180142)
江苏省青蓝工程项目.
-
文摘
中文手写文本识别是模式识别领域中的研究热点问题之一,其存在字符类别数量多、书写风格差异大和训练数据集标记难等问题.针对上述问题,提出无切分无循环的残差注意网络结构用于端到端手写文本识别.首先,以ResNet-26为主体结构,使用深度可分离卷积提取有意义特征,残差注意门控模块提升文本图像中的关键区域的重要性;其次,采用批量双线性插值模型对输入表征进行拉伸-挤压,实现二维文本表征到一维文本行表征的文本行上采样;最后,以连接时序分类作为识别模型的损失函数,实现高层次抽取表征与字符序列标记的对应关系.在CASIA-HWDB2.x和ICDAR2013两个数据集上进行实验研究,结果表明,所提方法在没有任何字符或文本行的位置信息时能够有效地实现端到端手写文本识别,且优于现有的方法.
-
关键词
手写文本识别
深度可分离卷积
残差注意门控
双线性插值
文本行上采样
连接时序分类
-
Keywords
handwritten text recognition
depthwise separable convolution
residual attention gate block
bilinear interpolation
text-lines up-sampling
connectionist temporal classification
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-