-
题名基于深度学习的印刷体文档字符识别的研究
被引量:8
- 1
-
-
作者
徐长英
赖伟财
陈英
-
机构
南昌航空大学工程训练中心
南昌航空大学软件学院
-
出处
《现代电子技术》
北大核心
2020年第23期72-75,共4页
-
基金
国家自然科学基金(61762067)。
-
文摘
针对传统基于模板匹配光学识别效果存在不理想的状态,提出改进的深度学习模型的印刷体文档字符识别算法。首先,生成包括一级字库、部分二级字库、英文大小写字母和标点符号的图片数据集,其数量大约为500万张;然后,在Lenet-5网络模型的基础上进行改进和重新构造,提出一种增强型的深度学习模型Lenet-5Pro,该模型可提高印刷体文档的识别率;最后,对比实验结果表明,该模型可以更加有效地提高印刷体字符识别的准确率,其字符识别准确率达到98%以上。
-
关键词
印刷体字符识别
深度学习
图片数据集
Lenet-5Pro
字符增强
仿真分析
-
Keywords
printed document character recognition
deep learning
image dataset
Lenet-5Pro
character enhancement
simulation analysis
-
分类号
TN911.73-34
[电子电信—通信与信息系统]
TP391
[电子电信—信息与通信工程]
-