-
题名基于模糊模式感知模块的场景文本图像超分辨率算法
- 1
-
-
作者
张密
余海洋
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机系统应用》
2024年第4期103-112,共10页
-
文摘
现有的场景文本识别器容易受到模糊文本图像的困扰,导致在实际应用中性能较差.因此近年来研究人员提出了多种场景文本图像超分辨率模型作为场景文本识别的预处理器,以提高输入图像的质量.然而,用于场景文本图像超分辨率任务的真实世界训练样本很难收集;此外,现有的场景文本图像超分辨率模型只学习将低分辨率(LR)文本图像转换为高分辨率(HR)文本图像,而忽略了从HR到LR图像的模糊模式.本文提出了模糊模式感知模块,该模块从现有的真实世界HR-LR文本图像对中学习模糊模式,并将其转移到其他HR图像中,以生成具有不同退化程度的LR图像.本文所提出的模糊模式感知模块可以为场景文本图像超分辨率模型生成大量的HR-LR图像对,以弥补训练数据的不足,从而显著提高性能.实验结果表明,当配备提出的模糊模式感知模块时,场景文本图像超分辨率方法的性能可以进一步提高,例如,SOTA方法TG在使用CRNN文本识别器进行评估时,识别准确率提高了5.8%.
-
关键词
场景文本图像超分辨率
场景文本识别
图像模糊模式
条件生成对抗网络
深度学习
-
Keywords
scene text image super-resolution(STISR)
scene text recognition
image blurring pattern
conditional generative adversarial network(CGAN)
deep learning
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-