期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
任意方向自然场景文本识别 被引量:2
1
作者 朱莉 陈宏 景小荣 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2022年第1期125-133,共9页
自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法。使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷积长短时记忆网络提取文本的时空序列信息,同时通过设计字符注... 自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法。使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷积长短时记忆网络提取文本的时空序列信息,同时通过设计字符注意机制使模型专注于字符上,并采用可微分二值化函数进一步加大网络对前景的注意力,削弱对背景区域的关注,网络对每个像素点进行37分类,并使用文本转录模块将分类结果按照从左到右的顺序转换成文本。该算法在包括ICDAR2013,ICDAR2003,SVTP,CUTE,IIIT5k的多个标准数据集上进行测试,测试结果表明,无论是规则文本还是不规则文本都取得了不错的效果,其中,在弯曲文本CUTE上的识别精度高达83.3%,充分证明了提出算法的有效性。 展开更多
关键词 自然场景文本识别 卷积长短时记忆网络(ConvLSTM) 字符注意力机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部