摘要
光学字符识别一直以来是计算机视觉领域的重要研究课题。如何进一步提高其在自然场景下的识别率是当前所面临的重大挑战。因此,提出了一个基于自然场景OCR自动纠错系统。首先构建了一个端到端的深度神经网络模型,该模型将特征提取、序列建模、序列转换集成到一个统一的框架,并可以进行端到端的训练。接着建立了一个二元语言模型,将深度神经网络模型输出的文字序列进行处理以达到自动纠错的目的。实验结果分析表明,该套系统在MJSynth数据集下有着非常高的识别率。
This paper proposes an automatic correction system of OCR based on natural scenes.Firstly, an end-to-end deep neural network architecture,which integrates feature extraction,sequence modeling and transcription into an unified framework,is proposed.Then a binary Language model is proposed to process the text sequences outputed by the deep neural network model to achieve automatic correction.
出处
《工业控制计算机》
2018年第11期98-99,共2页
Industrial Control Computer