期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
场景图像弯曲文本检测与识别
1
作者 刘航源 《计算机与数字工程》 2024年第6期1848-1853,共6页
随着深度学习技术的发展,场景文本检测与识别在近几年取得了巨大的进步,场景文本检测与识别的实现方式也越来越具有多样性。然而,场景文本的表示方式仍然以矩形和旋转矩形居多,该类文本表示方式难以精准表示弯曲的文本实例。为了解决弯... 随着深度学习技术的发展,场景文本检测与识别在近几年取得了巨大的进步,场景文本检测与识别的实现方式也越来越具有多样性。然而,场景文本的表示方式仍然以矩形和旋转矩形居多,该类文本表示方式难以精准表示弯曲的文本实例。为了解决弯曲文本的表示问题,论文提出了一种参数化的弯曲文本表示法,并且基于参数化表示法设计了弯曲文本纠正算法,实现了弯曲文本的形态纠正,降低了识别的难度。通过引入该方法,实现了功能完善的场景文本检测与识别系统。实验结果表明,此方法可以有效完成场景文本的检测与识别任务。 展开更多
关键词 场景文本检测 文本识别 弯曲文本 形态纠正
下载PDF
基于注意力机制和空洞卷积的自然场景弯曲文本检测方法 被引量:1
2
作者 陈欣 《微电子学与计算机》 2023年第8期10-18,共9页
自然场景的弯曲文本检测技术多用于智慧旅游场景.针对当前弯曲文本检测存在的受到卷积神经网络的感受野大小和提取特征能力有待提升的影响,网络难以识别自然场景图像中的文本和非文本区域问题,提出了一种基于注意力机制和空洞卷积的自... 自然场景的弯曲文本检测技术多用于智慧旅游场景.针对当前弯曲文本检测存在的受到卷积神经网络的感受野大小和提取特征能力有待提升的影响,网络难以识别自然场景图像中的文本和非文本区域问题,提出了一种基于注意力机制和空洞卷积的自然场景下文本检测方法(Resnet Squeeze and Excitation Dilation Jaccard Progressive Scale Expansion Network,RSDJ-PSE).RSDJ-PSE引入软注意力机制SE块在检测网络的骨干网络中,进一步增强了特征提取能力,接着引入空洞卷积到骨干网络中,扩展了卷积的感受野且不增大参数量,最后使用Jaccard系数替换Dice系数在后处理算法中,提升了该文本检测方法的F值.在定向文本数据集ICDAR2015、标准弯曲文本数据集CTW1500和Total-Text数据集上的检测结果表明:与8种检测方法对比,该方法具有最好的文本检测性能. 展开更多
关键词 弯曲文本 卷积神经网络 空洞卷积 残差网络
下载PDF
基于深度学习的铸件字符识别
3
作者 常秀 《运筹与模糊学》 2023年第2期1388-1400,共13页
针对铸件字符人工识别效率低、人工记录易出错,现有的字符识别方法无法应对工业场景下复杂的铸件字符,且场景本身存在极端光照、遮挡、模糊的问题,提出了改进的PGNet网络。该网络在识别水平文本的同时,也能很好地识别弯曲文本和不规则... 针对铸件字符人工识别效率低、人工记录易出错,现有的字符识别方法无法应对工业场景下复杂的铸件字符,且场景本身存在极端光照、遮挡、模糊的问题,提出了改进的PGNet网络。该网络在识别水平文本的同时,也能很好地识别弯曲文本和不规则文本。针对铸件字符数据量不足的情况,加入STN矫正模块进行数据增强,不同的实验结果表明,对准召的提升大于1%。此外,通过优化PGNet网络的损失函数,降低了误识别率。通过对PGNet网络的改进,在一定程度上解决了上述问题,使得铸件字符的溯源与管控过程更加准确和高效。 展开更多
关键词 工业智能 不规则文本 弯曲文本 PGNet网络 铸件字符识别
下载PDF
基于多边形偏移蒙版和边界增强的场景文本检测
4
作者 张智 秦瑶 顾进广 《计算机应用研究》 CSCD 北大核心 2021年第8期2474-2478,2484,共6页
目前,多方向文本检测方法已经在各种数据集上取得了不错的性能,但是任意形状文本检测仍然存在一些困难,尤其是具有不同大小、形状、方向、颜色和样式的文本实例。为了更好地区分连续任意形状的文本实例和周边非文本区域,提出了一种基于... 目前,多方向文本检测方法已经在各种数据集上取得了不错的性能,但是任意形状文本检测仍然存在一些困难,尤其是具有不同大小、形状、方向、颜色和样式的文本实例。为了更好地区分连续任意形状的文本实例和周边非文本区域,提出了一种基于分段的文本检测器,通过使用多边形偏移蒙版和边界增强来检测任意形状的场景文本。为了评估该方法的有效性,在ICDAR2015和Total-Text等公开数据集上进行了多组对比实验,实验结果证明该方法有着更卓越的性能。 展开更多
关键词 场景文本检测 弯曲文本检测 多边形偏移蒙版 边界增强
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部