期刊文献+
共找到127篇文章
< 1 2 7 >
每页显示 20 50 100
自然场景图像中的文本检测综述 被引量:51
1
作者 王润民 桑农 +4 位作者 丁丁 陈杰 叶齐祥 高常鑫 刘丽 《自动化学报》 EI CSCD 北大核心 2018年第12期2113-2141,共29页
本文对自然场景文本检测问题及其方法的研究进展进行了综述.首先,论述了自然场景文本的特点、自然场景文本检测技术的研究背景、现状以及主要技术路线.其次,从传统文本检测以及深度学习文本检测的视角出发,梳理、分析并比较了各类自然... 本文对自然场景文本检测问题及其方法的研究进展进行了综述.首先,论述了自然场景文本的特点、自然场景文本检测技术的研究背景、现状以及主要技术路线.其次,从传统文本检测以及深度学习文本检测的视角出发,梳理、分析并比较了各类自然场景文本检测方法的优缺点,并介绍了端对端文本识别技术.再次,论述了自然场景文本检测技术所面临的挑战,探讨了相应的解决方案.最后,本文列举了测试基准数据集、评估方法,将最具代表性的自然场景文本检测方法的性能进行了比较,本文还展望了本领域的发展趋势. 展开更多
关键词 文本检测 场景文本 深度学习 手工设计的特征 连通域分析
下载PDF
视频文本的自动提取方法 被引量:5
2
作者 郭丽 孙兴华 +1 位作者 黄元元 杨静宇 《小型微型计算机系统》 CSCD 北大核心 2004年第6期1086-1088,共3页
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法 ,首先用彩色边缘检测算子检测出图像中的边缘 ,然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域 ,并去掉部分孤立的噪声 ,再通过对连通域的分析和分解定位出文本区... 提出一种基于彩色边缘检测和游程平滑的视频文本提取方法 ,首先用彩色边缘检测算子检测出图像中的边缘 ,然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域 ,并去掉部分孤立的噪声 ,再通过对连通域的分析和分解定位出文本区域的边界 ,最后对文本区进行确认 .实验表明 ,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位 . 展开更多
关键词 彩色边缘检测 游程平滑 视频文本提取 图像文本 场景文本
下载PDF
自然场景文本检测技术研究综述 被引量:11
3
作者 白志程 李擎 +1 位作者 陈鹏 郭立晴 《工程科学学报》 EI CSCD 北大核心 2020年第11期1433-1448,共16页
文本检测在自动驾驶和跨模态图像检索中具有极为广泛的应用.该技术也是基于光学字符的文本识别任务中重要的前置环节.目前,复杂场景下的文本检测仍极具挑战性.本文对自然场景文本检测进行综述,回顾了针对该问题的主要技术和相关研究进展... 文本检测在自动驾驶和跨模态图像检索中具有极为广泛的应用.该技术也是基于光学字符的文本识别任务中重要的前置环节.目前,复杂场景下的文本检测仍极具挑战性.本文对自然场景文本检测进行综述,回顾了针对该问题的主要技术和相关研究进展,并对研究现状进行分析.首先对问题进行概述,分析了自然场景中文本检测的主要特点;接着,介绍了经典的基于连通域分析、基于滑动检测窗的自然场景文本检测技术;在此基础上,综述了近年来较为常用的深度学习文本检测技术;最后,对自然场景文本检测未来可能的研究方向进行展望. 展开更多
关键词 文本检测 场景文本 连通域分析 图像处理 统计学习 深度学习
下载PDF
基于改进MTSv2的场景文本检测和识别算法研究
4
作者 王艳媛 茅正冲 杨雨涵 《计算机测量与控制》 2024年第9期256-261,共6页
在自然场景图像中,丰富的文本内容对于全面理解场景非常重要。针对自然场景文本图像存在背景复杂、文本粘连、文本多角度等问题,提出一种基于改进MTSv2的文本检测和识别算法;检测算法以MTSv2为基础网络,采用CBAM注意力机制增大特征图中... 在自然场景图像中,丰富的文本内容对于全面理解场景非常重要。针对自然场景文本图像存在背景复杂、文本粘连、文本多角度等问题,提出一种基于改进MTSv2的文本检测和识别算法;检测算法以MTSv2为基础网络,采用CBAM注意力机制增大特征图中的小型文本的权重,更好捕捉图像中的关键特征;融合CE-FPN结构,减轻多尺度融合产生的特征混叠问题;引入focal loss函数,减少正负样本分布不均衡对识别准确率的影响,使网络更加关注难以分类的样本,改善模型的泛化能力;通过多个文本数据集进行训练,并在ICDAR2015数据集上进行验证,改进后模型对场景文本检测和识别的准确率达到了89.3%,召回率达到了87.6%,F_(1)值达到了88.5%,相比于原模型都有一定程度的提高。 展开更多
关键词 场景文本 文本检测 文本识别 CBAM CE-FPN 注意力机制
下载PDF
基于改进YOLOv5的快速水平文本检测算法
5
作者 孙巧榆 张静 刘珍兵 《江苏海洋大学学报(自然科学版)》 CAS 2024年第1期75-81,共7页
基于深度学习的文本检测算法具有强大的特征学习能力和泛化能力,但推理速度通常较慢。针对此问题,提出了基于改进YOLOv5的快速水平文本检测算法T-YOLOv5,通过在SPPF(spatial pyramid pooling-fast)模块中嵌入改进的CAM(channel attentio... 基于深度学习的文本检测算法具有强大的特征学习能力和泛化能力,但推理速度通常较慢。针对此问题,提出了基于改进YOLOv5的快速水平文本检测算法T-YOLOv5,通过在SPPF(spatial pyramid pooling-fast)模块中嵌入改进的CAM(channel attention module)提高网络的特征提取能力,并在CIoU(complete IoU)损失中增加形状损失提高损失函数的收敛速度。所提算法在公共数据集ICDAR2013上F值达到86.5,推理速度达112 FPS。实验结果表明,在检测结果和推理速度上,所提算法T-YOLOv5与现有基于深度学习的文本检测算法相比具有一定的竞争力。 展开更多
关键词 文本检测 深度学习 YOLOv5 场景文本
下载PDF
基于深度学习的场景文本检测方法研究综述
6
作者 张静 孙巧榆 刘珍兵 《智能计算机与应用》 2024年第2期48-54,共7页
文本检测技术在社会中有着广泛的应用,随着深度学习的加入,文本检测技术得到了进一步的提升。近年来基于深度学习的检测算法逐渐增多,针对场景文本检测的各种问题提出了相应的解决方法,提升了场景文本检测算法的性能。本文对这些算法进... 文本检测技术在社会中有着广泛的应用,随着深度学习的加入,文本检测技术得到了进一步的提升。近年来基于深度学习的检测算法逐渐增多,针对场景文本检测的各种问题提出了相应的解决方法,提升了场景文本检测算法的性能。本文对这些算法进行了归纳、分析和总结,将这些算法大致分为基于回归和基于分割两种类型,并对其性能进行了对比,最后基于这些算法的研究内容为文本检测领域未来的发展提出了新的研究方向。 展开更多
关键词 深度学习 文本检测 场景文本
下载PDF
图像与视频中的文本定位技术研究综述 被引量:4
7
作者 廖佳 王红梅 牛晓东 《电脑知识与技术(过刊)》 2010年第9X期7378-7382,共5页
图像与视频中的文字分人工添加文本和自然场景文本。按照每种文本各自的特征又有多种文本定位方法。依据人工文本与场景文本的特征进行文本定位技术的分类与分析,介绍了最新的国内外研究现状,并对文本定位算法的性能评价标准和今后研究... 图像与视频中的文字分人工添加文本和自然场景文本。按照每种文本各自的特征又有多种文本定位方法。依据人工文本与场景文本的特征进行文本定位技术的分类与分析,介绍了最新的国内外研究现状,并对文本定位算法的性能评价标准和今后研究方向进行了深入讨论。 展开更多
关键词 人工文本 场景文本 文本检测 文本定位 文本提取
下载PDF
基于MSER拟合椭圆的快速场景文本定位算法 被引量:6
8
作者 高士林 吉立新 +1 位作者 李绍梅 许喆 《计算机工程与设计》 北大核心 2015年第3期693-698,720,共7页
针对图像中场景文本定位效率低的问题,提出一种基于最大稳定极值区的快速定位算法。快速提取图像中的最大稳定极值区;对提取的极值区进行椭圆拟合,构造MSER描述,利用拟合椭圆特征筛选极值区,滤除大部分伪字符区;运用以MSER为元素的投影... 针对图像中场景文本定位效率低的问题,提出一种基于最大稳定极值区的快速定位算法。快速提取图像中的最大稳定极值区;对提取的极值区进行椭圆拟合,构造MSER描述,利用拟合椭圆特征筛选极值区,滤除大部分伪字符区;运用以MSER为元素的投影合并算法,将字符区分割文本行并直接合并成单词,确定文本区。该算法通过拟合椭圆的特征选取实现伪字符区滤除,通过快速的投影合并算法,实现了高效的场景文本定位。实验结果表明,与其它算法相比,该算法能够达到较好的定位效果,在速度上具有优势。 展开更多
关键词 场景文本 最大稳定极值区 拟合椭圆 伪字符区滤除 投影合并算法
下载PDF
基于字符连接的场景文本检测
9
作者 王良君 季宇航 顾维杰 《计算机与数字工程》 2024年第7期2108-2114,共7页
近年来,场景文本检测的研究方向越发广泛,得益于深度卷积网络与图像分割技术的发展,场景文本检测器能够针对图像中任意形状的弯曲文本,生成多样的文本框。另外,场景图像中的文本时而表现出文字过小,长宽比过于极端等特点,这些实例在深... 近年来,场景文本检测的研究方向越发广泛,得益于深度卷积网络与图像分割技术的发展,场景文本检测器能够针对图像中任意形状的弯曲文本,生成多样的文本框。另外,场景图像中的文本时而表现出文字过小,长宽比过于极端等特点,这些实例在深度卷积和有限感受野的情况下,网络很容易丢失小文本的特征信息,获取不到长文本的完整特征。针对这两个难点,论文设计了基于字符连接的场景文本检测器,使用改进的AFF模块,将局部特征与全局特征融合起来,使网络对小文本目标更加敏感,避免小文本漏检的问题。网络输出字符区域与字符间隙得分,根据字符之间的连接属性连接文本行,使网络在有限感受野的情况下能够检测任意长文本。由于通用文本检测数据集缺少字符级的标注,论文使用弱监督学习策略来生成字符级伪标签,并制作了字符级的合成数据集来弥补弱监督学习的不足,使网络能够更好地学习场景文本的特征。实验结果表明,该方法在通用数据集ICDAR2015以及MSRA-TD500上均展现了优异的性能。 展开更多
关键词 场景文本 注意力特征融合 弱监督学习 字符连接
下载PDF
改进的Gabor小波变换特征提取方法 被引量:5
10
作者 尹芳 陈德运 吴锐 《计算机工程》 CAS CSCD 2012年第15期145-147,共3页
针对自然场景中文本存在图像背景复杂、颜色多变、噪声强烈,图像存在变形、残缺、模糊、断裂等问题,提出一种基于方向预分类的Gabor小波变换特征提取方法。利用Gabor函数良好的频率选择性和方向选择性,同时考虑到笔划相对位置的偏移,方... 针对自然场景中文本存在图像背景复杂、颜色多变、噪声强烈,图像存在变形、残缺、模糊、断裂等问题,提出一种基于方向预分类的Gabor小波变换特征提取方法。利用Gabor函数良好的频率选择性和方向选择性,同时考虑到笔划相对位置的偏移,方向预分类使得滤波器对笔划方向的选择更有针对性。实验结果证明,该特征提取方法对笔划变形和低分辨率字符具有较好的适应性,能有效解决低质量场景文本的识别问题。 展开更多
关键词 GABOR小波特征 方向预分类 模糊笔划方向 特征提取 场景文本 文本识别
下载PDF
层级语义融合的场景文本检测 被引量:1
11
作者 王紫霄 谢洪涛 +1 位作者 王裕鑫 张勇东 《中国图象图形学报》 CSCD 北大核心 2023年第8期2343-2355,共13页
目的场景文本检测是场景理解和文字识别领域的重要任务之一,尽管基于深度学习的算法显著提升了检测精度,但现有的方法由于对文字局部语义和文字实例间的全局语义的提取能力不足,导致缺乏文字多层语义的建模,从而检测精度不理想。针对此... 目的场景文本检测是场景理解和文字识别领域的重要任务之一,尽管基于深度学习的算法显著提升了检测精度,但现有的方法由于对文字局部语义和文字实例间的全局语义的提取能力不足,导致缺乏文字多层语义的建模,从而检测精度不理想。针对此问题,提出了一种层级语义融合的场景文本检测算法。方法该方法包括基于文本片段的局部语义理解模块和基于文本实例的全局语义理解模块,以分别引导网络关注文字局部和文字实例间的多层级语义信息。首先,基于文本片段的局部语义理解模块根据相对位置将文本划分为多个片段,在细粒度优化目标的监督下增强网络对局部语义的感知能力。然后,基于文本实例的全局语义理解模块利用文本片段粗分割结果过滤背景区域并提取可靠的文字区域特征,进而通过注意力机制自适应地捕获任意形状文本的全局语义信息并得到最终分割结果。此外,为了降低边界区域的预测噪声对层级语义信息聚合的干扰,提出边界感知损失函数以降低边界区域特征的歧义性。结果算法在3个常用的场景文字检测数据集上实验并与其他算法进行了比较,所提方法在性能上获得了显著提升,在Totoal-Text数据集上,F值为87.0%,相比其他模型提升了1.0%;在MSRA-TD500(MSRA text detection 500 database)数据集上,F值为88.2%,相比其他模型提升了1.0%;在ICDAR 2015(International Conference on Document Analysis and Recognition)数据集上,F值为87.0%。结论提出的模型通过分别构建不同层级下的语义上下文和对歧义特征额外的惩罚解决了层级语义提取不充分的问题,获得了更高的检测精度。 展开更多
关键词 场景文本 文字检测 全卷积网络(FCN) 卷积神经网络(CNN) 特征融合 注意力机制
原文传递
基于端到端的复杂场景中文文字识别方法研究
12
作者 帅梓涵 胡金蓉 +2 位作者 郎子鑫 罗月梅 李桂钢 《数据挖掘》 2023年第2期154-164,共11页
近年来,由于成功挖掘了场景文本检测和识别的内在协同作用,端到端场景文本识别引起了人们的极大关注。然而,最近最先进的方法通常仅通过共享主干来结合检测和识别,这些方法由于其尺度和纵横比的极端变化不能很好地处理场景文本。在本文... 近年来,由于成功挖掘了场景文本检测和识别的内在协同作用,端到端场景文本识别引起了人们的极大关注。然而,最近最先进的方法通常仅通过共享主干来结合检测和识别,这些方法由于其尺度和纵横比的极端变化不能很好地处理场景文本。在本文中,我们提出了一种新的端到端场景文本识别框架,称为ES-Transformer。与以往以整体方式学习场景文本的方法不同,我们的方法基于几个代表性特征来执行场景文本识别,这避免了背景干扰并降低了计算成本。具体来说,使用基本特征金字塔网络进行特征提取,然后,我们采用Swin-Transformer来建模采样特征之间的关系,从而有效地将它们划分为合理的组。在提升识别精度的同时降低了计算复杂度,不再依赖于繁杂的后处理模块。对中文数据集的定性和定量实验表明,ES-Transformer优于现有方法。 展开更多
关键词 场景文本 计算成本 特征提取 特征金字塔 识别框架 复杂场景 背景干扰 纵横比
下载PDF
基于消失点的场景文本透视变形校正方法 被引量:3
13
作者 陈德运 尹芳 吴锐 《南京理工大学学报》 EI CAS CSCD 北大核心 2011年第4期436-441,共6页
针对自然场景文本识别过程中文本图像的透视变形问题,提出一种有效的基于消失点的场景文本透视变形校正方法。该方法首先利用由文本字符边缘端点拟合得到的文本基线检测消失点,然后利用消失点信息估计单应矩阵部分参数,使用单应矩阵实... 针对自然场景文本识别过程中文本图像的透视变形问题,提出一种有效的基于消失点的场景文本透视变形校正方法。该方法首先利用由文本字符边缘端点拟合得到的文本基线检测消失点,然后利用消失点信息估计单应矩阵部分参数,使用单应矩阵实现图像校正,得到正视的文本图像。与其他方法相比,该方法受文本版式的限制更少。实验结果表明,该方法能有效校正文字行数较少的场景文本,明显提高字符识别率。 展开更多
关键词 场景文本 透视变形 变形校正 消失点
下载PDF
MSER快速自然场景倾斜文本定位算法 被引量:3
14
作者 张开玉 邵康一 卢迪 《哈尔滨理工大学学报》 CAS 北大核心 2019年第2期81-88,共8页
针对在自然场景中文本定位需要大量样本训练导致算法运行速度较慢且倾斜文本难以定位的问题,提出了一种基于最大稳定极值区域(maximally stable extremal regions,MSER)结合层次聚类的快速自然场景倾斜文本定位算法。利用MSER椭圆拟合... 针对在自然场景中文本定位需要大量样本训练导致算法运行速度较慢且倾斜文本难以定位的问题,提出了一种基于最大稳定极值区域(maximally stable extremal regions,MSER)结合层次聚类的快速自然场景倾斜文本定位算法。利用MSER椭圆拟合的方法对图片进行最大极值稳定区域的选取,并根据拟合椭圆的自身特征和在图像上的位置特征,过滤掉大部分的非文本区域,筛选出文本候选区域。运用层次聚类的思想,快速对文本区域逐层聚类融合,最终将单个的文本区域合并成单词区域,实现高效的倾斜场景文本定位。实验结果表明,与传统的定位算法相比,该算法在没有损失定位精度的情况下运算速度有明显的提升。 展开更多
关键词 场景文本 最大稳定极值区域 层次聚类 椭圆拟合
下载PDF
基于小波特征提取的视频文字检测系统设计和实现
15
作者 梅龙宝 冯慧君 《电视技术》 北大核心 2004年第3期88-90,共3页
针对目前一般采用的基于视图的知识模型方法或统计模型方法存在的问题,提出了一种基于小波变换及特征提取器的方法,并进行系统设计和检测,实验证明了该方法的有效性。
关键词 小波变换 特征提取 视频文字检测 场景文本 图形文本
下载PDF
基于连通域的图像中场景文本定位 被引量:1
16
作者 姚金良 赵先章 +1 位作者 曾隽芳 杨一平 《高技术通讯》 CAS CSCD 北大核心 2007年第6期612-617,共6页
提出了一种基于连通域的自动定位图像中场景文本的方法。该方法充分利用了场景文本的两类特征——字符特征和文本区域特征,同时对一些字符特征进行组合,组合得到的新字符特征能够对字符的大小、字体等有很好的不变性。该方法利用级联弱... 提出了一种基于连通域的自动定位图像中场景文本的方法。该方法充分利用了场景文本的两类特征——字符特征和文本区域特征,同时对一些字符特征进行组合,组合得到的新字符特征能够对字符的大小、字体等有很好的不变性。该方法利用级联弱分类器将所有的特征组合到一个框架中,提高了处理速度。实验结果显示,该方法对字符的大小、颜色、语言等具有很好的鲁棒性,并具有较高的召回率。 展开更多
关键词 连通域分析 场景文本 文本定位 Niblack
下载PDF
文本线局部极值区域两阶段场景文本序列识别 被引量:1
17
作者 董引娣 赵晓祎 《计算机科学与探索》 CSCD 北大核心 2018年第8期1323-1330,共8页
为提高场景文本识别算法的计算效率和精度,提出基于文本线局部极值区域两阶段场景文本序列识别方法。首先,利用特征计算对每个构建的极值区域字符进行概率计算,并选取局部最大概率特征作为第一阶段的输出和第二阶段的输入。其次,利用高... 为提高场景文本识别算法的计算效率和精度,提出基于文本线局部极值区域两阶段场景文本序列识别方法。首先,利用特征计算对每个构建的极值区域字符进行概率计算,并选取局部最大概率特征作为第一阶段的输出和第二阶段的输入。其次,利用高效的聚类算法将极值区域字符进行文本线处理,利用字符区域的标签以及OCR分类器进行字体合成,在上下文中的每个字符的文本线已知的情况下,可实现最有可能字符序列的快速选取。最后,通过在USTB-SV1K数据库对多方向文本的仿真测试,验证了算法在计算效率和计算精度上的优势。 展开更多
关键词 文本线 局部极值 两阶段 场景文本 序列识别
下载PDF
结合区域颜色一致性和图割的复杂场景文本分割方法 被引量:1
18
作者 刘晓佩 《控制与决策》 EI CSCD 北大核心 2015年第11期1987-1992,共6页
针对复杂场景文本难以有效分割的问题,提出一种复杂场景文本分割方法.首先,使用简单的线性迭代聚类(SLIC)算法将原始图像分割为若干局部区域,并在其区域邻接图上构建图割模型;然后,采用高斯混合模型(GMMs)和支持向量机(SVM)后验概率模... 针对复杂场景文本难以有效分割的问题,提出一种复杂场景文本分割方法.首先,使用简单的线性迭代聚类(SLIC)算法将原始图像分割为若干局部区域,并在其区域邻接图上构建图割模型;然后,采用高斯混合模型(GMMs)和支持向量机(SVM)后验概率模型对场景文本进行建模,并引入每个局部区域与模型之间的匹配度用于计算似然能.为了增强GMMs的鉴别力,在参数学习中引入模型性能描述子,自适应地获得模型参数.实验结果表明,所提出的算法能够较好地处理复杂场景文本分割问题,文本的识别率得到了明显的提升. 展开更多
关键词 文档分析 场景文本 文本分割 图割
原文传递
基于树修剪和多特征融合的场景文本检测 被引量:1
19
作者 肖诚求 吉立新 +1 位作者 高超 李邵梅 《信息工程大学学报》 2015年第5期590-595,601,共7页
为了解决最大稳定极值区(MSER)提取过程中产生的大量重复文本区域和非文本区域难以被剔除影响算法精度的问题,提出了一种基于树修剪和多特征融合的场景文本检测方法。首先提取出边缘叠加的MSER作为文本候选区域;其次设计了一种MSER树修... 为了解决最大稳定极值区(MSER)提取过程中产生的大量重复文本区域和非文本区域难以被剔除影响算法精度的问题,提出了一种基于树修剪和多特征融合的场景文本检测方法。首先提取出边缘叠加的MSER作为文本候选区域;其次设计了一种MSER树修剪算法剔除重复文本区域;然后采用贝叶斯分类器融合多特征剔除非文本区域;最后设定了一系列相似性标准合并文本区域。ICDAR 2011数据集(f=76.8%)上的实验结果低于目前最好的算法[19],但算法在速度上具有明显的优势。 展开更多
关键词 MSER树修剪 多特征融合 场景文本 最大稳定极值区 贝叶斯多特征融合分类器
下载PDF
场景文本检测算法综述
20
作者 牛钦 《计算机时代》 2021年第6期19-21,25,共4页
场景文本检测是计算机视觉领域研究的主要方向。文章介绍了近几年深度学习技术在场景文本检测上的应用,包括对场景文本图像检测中存在问题的描述,对近些年场景文本检测算法的分类和分析,以及场景文本检测数据集的介绍。最后总结并展望... 场景文本检测是计算机视觉领域研究的主要方向。文章介绍了近几年深度学习技术在场景文本检测上的应用,包括对场景文本图像检测中存在问题的描述,对近些年场景文本检测算法的分类和分析,以及场景文本检测数据集的介绍。最后总结并展望了未来场景文本检测的发展趋势。 展开更多
关键词 场景文本 计算机视觉 深度学习 文本检测
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部