-
题名基于改进YOLOv5s的离线手写数学符号识别
被引量:2
- 1
-
-
作者
方洪波
万广
陈忠辉
黄以卫
张文勇
谢本亮
-
机构
贵州大学大数据与信息工程学院
教育部半导体功率器件可靠性工程中心
贵州财经大学西部现代化研究中心
贵州大学计算机科学与技术学院
-
出处
《图学学报》
CSCD
北大核心
2022年第3期387-395,共9页
-
基金
国家自然科学基金项目(61562009)
国家重点研发计划课题(2016YFD0201305-07)
+1 种基金
贵州大学人才引进科研项目(贵大人基合字(2015)29号)
半导体功率器件教育部工程研究中心开放基金项目(ERCMEKFJJ2019-(06))。
-
文摘
离线数学符号识别是离线数学表达式识别的前提。针对现有离线符号识别方法只是单纯的对符号进行识别,对离线表达式识别的其他环节未有任何帮助,反而会限制表达式识别,提出一种改进YOLOv5s的离线符号识别方法。首先,根据符号图像小的特点,用生成对抗网络(GAN)进行数据增强;其次,从符号类别的角度分析,在YOLOv5s模型中引入空间注意力机制,利用全局最大值和全局平均值池化,扩大类别间的差异特征;最后,从符号自身角度分析,引入双向长短期记忆网络(BiLSTM)对符号特征矩阵进行处理,使符号特征具有上下相关联的信息。实验结果表明:改进后的YOLOv5s取得较好离线符号识别效果,有92.47%的识别率,与其他方法进行对比,证明了其有效性和稳健性。同时,能有效避免离线数学表达式识别中错误累积的问题,且能为表达式的结构分析提供有效依据。
-
关键词
离线手写数学符号识别
数据增强
生成对抗网络
空间注意力机制
双向长短期记忆网络
-
Keywords
offline handwriting mathematical symbol recognition
data enhancement
generative adversarial network
spatial attention mechanism
bidirectional long-short-term memory network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-