期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
视频帧中提取文字区域的算法 被引量:3
1
作者 马小勇 谢萍 张宪民 《计算机工程》 CAS CSCD 北大核心 2003年第9期155-157,共3页
提出了一种在视频帧中提取文字区域的算法,该算法基于文字的纹理特征—— 角点,即文字,特别是汉字,含有丰富的角点。首先,在视频帧中进行角点检测,得到视频帧的角点分布图。第2步是进行角点滤波,即在角点分布图中剔除一些比较分... 提出了一种在视频帧中提取文字区域的算法,该算法基于文字的纹理特征—— 角点,即文字,特别是汉字,含有丰富的角点。首先,在视频帧中进行角点检测,得到视频帧的角点分布图。第2步是进行角点滤波,即在角点分布图中剔除一些比较分散的,可以认为不是从文字中检测到的角点。第3步对角点分布图中余下的角点聚类形成候选文字区域,采用水平方向和竖直方向的投影对这些区域进行分化。第4步文字区域的最后确认,除去噪声。实验表明该算法计算速度快,提取文字区域准确。 展开更多
关键词 文字区域提取 角点检测 投影
下载PDF
基于多边形特征池化与融合的复杂文本检测
2
作者 张相南 高新波 田春娜 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第3期113-123,共11页
文本检测在图像理解中发挥着重要的作用。基于深度学习的文本检测是当前的主流算法,包括单阶段方法和双阶段方法两类,而且后者的检测精度往往高于前者。双阶段的检测方法通常包含感兴趣区域特征池化操作,为进一步的检测和识别任务提供... 文本检测在图像理解中发挥着重要的作用。基于深度学习的文本检测是当前的主流算法,包括单阶段方法和双阶段方法两类,而且后者的检测精度往往高于前者。双阶段的检测方法通常包含感兴趣区域特征池化操作,为进一步的检测和识别任务提供特定维度的局部区域特征。然而对于弯曲文本等复杂文本区域来说,现有的基于矩形感兴趣区域的池化方法不再适用,而基于点特征替代区域特征的方法又损失了空间信息。针对该问题,提出了一种基于多边形特征池化和Transformer的复杂文本区域检测方法。首先,将复杂文本区域检测中感兴趣区域进行多边形特征池化,将池化操作的区域形状从矩形拓展到多边形并且不需要借助其他形状进行拟合,即可将多边形区域对应的特征池化为固定维度的特征序列,避免了拟合过程中出现误差。进而,将池化后的特征视为具有空间关系的序列,然后利用Transformer融合视觉特征之间的上下文关系,降低训练难度,提升检测精确度。在包含弯曲文本等复杂文本情况的ICDAR2015、MLT、Total Text和CTW1500数据集上的测试实验结果表明,提出的双阶段检测算法能更好地提取感兴趣区域特征,并取得了比现有方法更好的检测结果。 展开更多
关键词 文本检测 双阶段方法 多边形 特征池化 TRANSFORMER
下载PDF
基于深度学习的图片敏感文字检测 被引量:4
3
作者 吴财贵 唐权华 《计算机工程与应用》 CSCD 北大核心 2015年第14期203-206,230,共5页
为快速检测图片文字中的敏感词汇,引入深度学习的方法进行文字检测和识别。对图片预处理,对连通区域进行标记;利用两层限制玻尔兹曼机(RBM)对连通区域进行文字区域的判别和选取;利用水平投影和区域生长的方法对得到的文字区域进行字符... 为快速检测图片文字中的敏感词汇,引入深度学习的方法进行文字检测和识别。对图片预处理,对连通区域进行标记;利用两层限制玻尔兹曼机(RBM)对连通区域进行文字区域的判别和选取;利用水平投影和区域生长的方法对得到的文字区域进行字符的分割;用BP神经网络算法和深信度网络(DBN)算法结合对敏感信息进行检测。敏感文字检测理论分析和实验数据表明该方法的算法复杂度低,检测速度快。 展开更多
关键词 图像处理 文字区域提取 敏感词检测 深度学习 限制玻尔兹曼机 深信度网络
下载PDF
Robust Video Text Detection with Morphological Filtering Enhanced MSER 被引量:2
4
作者 诸葛云志 卢湖川 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第2期353-363,共11页
Video text detection is a challenging problem, since video image background is generally complex and its subtitles often have the problems of color bleeding, fuzzy boundaries and low contrast due to video lossy compre... Video text detection is a challenging problem, since video image background is generally complex and its subtitles often have the problems of color bleeding, fuzzy boundaries and low contrast due to video lossy compression and low resolution. In this paper, we propose a robust framework to solve these problems. Firstly, we exploit gradient amplitude map (GAM) to enhance the edge of an input image, which can overcome the problems of color bleeding and fuzzy boundaries. Secondly, a two-direction morphological filtering is developed to filter background noise and enhance the contrast between background and text. Thirdly, maximally stable extremal region (MSER) is applied to detect text regions with two extreme colors, and we use the mean intensity of the regions as the graph cuts' label set, and the Euclidean distance of three channels in HSI color space as the graph cuts smooth term, to get optimal segmentations. Finally, we group them into text lines using the geometric characteristics of the text, and then corner detection, multi-frame verification, and some heuristic rules are used to eliminate non-text regions. We test our scheme with some challenging videos, and the results prove that our text detection framework is more robust than previous methods. 展开更多
关键词 text detection gradient amplitude map morphological filtering maximally stable extremM region graph cuts
原文传递
基于改进CTPN网络的电气铭牌文本区域检测 被引量:2
5
作者 石煌雄 胡洋 +2 位作者 蒋作 潘文林 杨凡 《云南民族大学学报(自然科学版)》 CAS 2023年第1期96-102,共7页
针对现有的文本区域检测网络对图像特征提取不充分,导致文本行间距过小或字间距过大的电气铭牌文本区域检测准确率低、误检率高,提出一种融合ResNet的改进CTPN算法用于电气铭牌文本区域检测.该模型在卷积神经网络模块中引入残差连接和... 针对现有的文本区域检测网络对图像特征提取不充分,导致文本行间距过小或字间距过大的电气铭牌文本区域检测准确率低、误检率高,提出一种融合ResNet的改进CTPN算法用于电气铭牌文本区域检测.该模型在卷积神经网络模块中引入残差连接和并行卷积核操作,提升模型对铭牌图像提取特征的能力.在长短期记忆网络模块采用双向门控单元,降低模型训练难度.经实验验证,改进后的CTPN模型F值(F-measure)明显提升,对铭牌文本区域误检率显著降低. 展开更多
关键词 电气铭牌 文本区域检测 CTPN算法 卷积神经网络 长短期记忆网络
下载PDF
图像垃圾邮件中文本区域的自动提取方法 被引量:1
6
作者 程红蓉 秦志光 +3 位作者 万明成 王灿 靳京 傅翀 《解放军理工大学学报(自然科学版)》 EI 北大核心 2009年第3期258-261,共4页
图像中的文本区域为判别图像垃圾邮件提供了重要依据。为了获得图像中的文本区域信息,提出了基于Hough变换提取图像中倾斜文本区域的算法和降低图像背景干扰的八邻域细小边缘去除算法,实现了一种不受图像中文本颜色、字体、大小、位置... 图像中的文本区域为判别图像垃圾邮件提供了重要依据。为了获得图像中的文本区域信息,提出了基于Hough变换提取图像中倾斜文本区域的算法和降低图像背景干扰的八邻域细小边缘去除算法,实现了一种不受图像中文本颜色、字体、大小、位置、方向限制的文本区域的自动提取方法。在包含100幅垃圾图像的数据集上进行提取图像文本区域的实验。实验结果显示,新方法具有良好的文本区域提取性能。 展开更多
关键词 HOUGH变换 文本区域提取 图像垃圾邮件判别 彩色边缘检测
下载PDF
基于笔画生长的自然场景艺术文字检测
7
作者 梁添才 罗攀峰 +1 位作者 张永 聂芸芸 《计算机仿真》 CSCD 北大核心 2015年第8期284-288,共5页
自然场景图像中的文字信息属于高层语义信息,通常与图像内容紧密相关,是理解图像场景内容的重要线索。由于图像中的文字通常具有复杂的字体变化,使得现有的文字检测技术难以获得较好的检测结果。为了解决场景文字检测受到字体自身笔画... 自然场景图像中的文字信息属于高层语义信息,通常与图像内容紧密相关,是理解图像场景内容的重要线索。由于图像中的文字通常具有复杂的字体变化,使得现有的文字检测技术难以获得较好的检测结果。为了解决场景文字检测受到字体自身笔画属性的影响,提出一种针对笔画宽度不均匀的艺术字体的检测方法。首先采用笔画宽度变换算法沿垂直于图像边缘的方向搜索平行边缘对,确定笔画候选位置;其次在具有强平行特征的边缘对内侧采样笔画前景种子像素,在边缘对外侧采样背景种子像素。采用核密度估计方法计算图像范围内任意像素属于笔画像素的似然函数;最后以该似然函数为权重函数,采用基于颜色特征的区域生长法,将笔画覆盖范围由具有强边缘平行特征的前景种子像素蔓延至完整笔画区域,从而实现笔画区域的精确提取。实验表明上述方法具有快速、有效、稳定的特点,尤其适用于自然场景中笔画宽度不均匀的艺术字体的检测。 展开更多
关键词 文字分割 笔画宽度变换 区域生长 艺术字检测
下载PDF
视频和图像文本提取方法综述 被引量:10
8
作者 蒋梦迪 程江华 +1 位作者 陈明辉 库锡树 《计算机科学》 CSCD 北大核心 2017年第B11期8-18,共11页
文本提取在视频和图像中具有重要的应用价值。近年来,大数据时代带来了海量信息检索的迫切需求,大量视频和图像中文本的提取方法涌现出来。回顾了视频和图像中文本提取的算法,从文本提取流程出发,将其分为文本区域检测定位和文本分割两... 文本提取在视频和图像中具有重要的应用价值。近年来,大数据时代带来了海量信息检索的迫切需求,大量视频和图像中文本的提取方法涌现出来。回顾了视频和图像中文本提取的算法,从文本提取流程出发,将其分为文本区域检测定位和文本分割两大步骤。在每个步骤中,分析并比较了现有算法的使用范围及相对优缺点,讨论了图像公用数据库,列举了近些年来图像中文本提取的重要应用,指出了当前研究中存在的问题,展望了视频和场景图像文本提取方法的发展趋势。 展开更多
关键词 视频和图像 文本提取 文本区域检测与定位 文本分割 综述
下载PDF
自然场景图像文字检测研究综述 被引量:8
9
作者 郭芬红 谢立艳 熊昌镇 《计算机应用》 CSCD 北大核心 2018年第A01期173-178,共6页
文字是图像内容的重要表达,随着基于内容的图像检索技术的发展,复杂场景图像下的文字检测技术越来越受关注,针对此类图像对现有的主流算法进行了详细的研究。文字检测算法主要包括候选文本区域提取和文本/非文本分类两大核心步骤。首先... 文字是图像内容的重要表达,随着基于内容的图像检索技术的发展,复杂场景图像下的文字检测技术越来越受关注,针对此类图像对现有的主流算法进行了详细的研究。文字检测算法主要包括候选文本区域提取和文本/非文本分类两大核心步骤。首先,总结了近5年的21种主流算法在公开数据集ICDAR上的文字检测效果,数据显示现有文字检测算法依然存在低召回率的问题,召回率最高为0. 83;其次,对候选文本区域提取和文本/非文本分类两大核心步骤中典型算法的优缺点及存在的问题进行了详细的分析;最后,探讨了文字检测未来的发展趋势,并提出了4种可能的研究方向。 展开更多
关键词 文本检测 场景图像 最大稳定极值区域 关键点检测 深度学习
下载PDF
基于聚类与边缘检测的自然场景文本提取方法 被引量:4
10
作者 常莹 何东健 李宗儒 《计算机工程与设计》 CSCD 北大核心 2010年第18期4040-4043,共4页
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法。该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分... 为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法。该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取。实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域。 展开更多
关键词 自然场景 文本提取 聚类 连通区域标记与分析 边缘检测
下载PDF
基于深度学习的多方向维吾尔文区域检测
11
作者 阿卜杜外力·如则 帕力旦·吐尔逊 +1 位作者 阿布都萨拉木·达吾提 艾斯卡尔·艾木都拉 《电视技术》 2019年第11期71-78,共8页
自然场景文本的背景复杂,很难确定文本位置,文本检测带来很大的挑战。从而提出一个基于目标检测的改进Yolo(You Only Look Once)自然场景多方向文本区域检测模型。在收集的2500张训练和500张测试多方向维吾尔文数据集上,通过改进的K-me... 自然场景文本的背景复杂,很难确定文本位置,文本检测带来很大的挑战。从而提出一个基于目标检测的改进Yolo(You Only Look Once)自然场景多方向文本区域检测模型。在收集的2500张训练和500张测试多方向维吾尔文数据集上,通过改进的K-means算法生成3种固定宽度的预设Anchor,对文本区域进行分类和多个垂直的矩形预测框位置回归,生成多方向文本检测框。检测文本预测框不同的连接和融合方式,检测多方向维吾尔文本,减少对角线上多余背景。在测试集上的实验中,得到了77%的准确率。实验结果表明,改进的Yolo v3模型在多方向维吾尔文场景文字区域检测任务中具有鲁棒性和应用性。 展开更多
关键词 维吾尔文本区域检测 场景文本 深度学习 改进的Yolo 多方向检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部