期刊文献+
共找到67篇文章
< 1 2 4 >
每页显示 20 50 100
自然场景文本检测与识别的深度学习方法 被引量:35
1
作者 刘崇宇 陈晓雪 +3 位作者 罗灿杰 金连文 薛洋 刘禹良 《中国图象图形学报》 CSCD 北大核心 2021年第6期1330-1367,共38页
许多自然场景图像中都包含丰富的文本,它们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等。因此,自然场景文本的分析与处理也越来越成为计算机视觉领域... 许多自然场景图像中都包含丰富的文本,它们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等。因此,自然场景文本的分析与处理也越来越成为计算机视觉领域的研究热点之一,该任务主要包括文本检测与识别。传统的文本检测和识别方法依赖于人工设计的特征和规则,且模型设计复杂、效率低、泛化性能差。随着深度学习的发展,自然场景文本检测、自然场景文本识别以及端到端的自然场景文本检测与识别都取得了突破性的进展,其性能和效率都得到了显著提高。本文介绍了该领域相关的研究背景,对基于深度学习的自然场景文本检测、识别以及端到端自然场景文本检测与识别的方法进行整理分类、归纳和总结,阐述了各类方法的基本思想和优缺点。并针对隶属于不同类别下的方法,进一步论述和分析这些主要模型的算法流程、适用场景和技术发展路线。此外,列举说明了部分主流公开数据集,对比了各个模型方法在代表性数据集上的性能情况。最后总结了目前不同场景数据下的自然场景文本检测、识别及端到端自然场景文本检测与识别算法的局限性以及未来的挑战和发展趋势。 展开更多
关键词 自然场景文本检测 自然场景文本识别(STR) 端到端自然场景文本检测与识别 深度学习 光学字符识别(ocr) 综述
原文传递
基于有向单连通链的表格框线检测算法 被引量:23
2
作者 郑冶枫 刘长松 +1 位作者 丁晓青 潘世言 《软件学报》 EI CSCD 北大核心 2002年第4期790-796,共7页
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是... 表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求、实验证明,该算法具有速度较快、鲁棒性高、抗任意角度的倾斜、抗断裂等优点. 展开更多
关键词 表格识别 图像分析 光学字符识别 智能文档处理 表格框线检测算法 有向单连通链
下载PDF
利用OCR识别技术实现视频中文字的提取 被引量:22
3
作者 陈义 李言俊 孙小炜 《计算机工程与应用》 CSCD 北大核心 2010年第10期180-183,共4页
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方... 为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。 展开更多
关键词 光学文字识别 文字事件检测 数字视频
下载PDF
基于霍夫变换的铭牌OCR图像旋转矫正方法 被引量:14
4
作者 张勇红 《电测与仪表》 北大核心 2015年第8期125-128,共4页
在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character... 在对互感器铭牌图像进行扫描输入时,铭牌图像或多或少会出现一定程度的倾斜,这种图像的倾斜最终会导致其字符识别准确率下降。针对此问题提出一种基于霍夫变换获取图像倾斜角度,进而通过图像旋转矫正提高光学字符识别(Optical Character Recognition,OCR)准确率的方法:首先对原始图像进行二值化,进而获得铭牌的轮廓,再采用基于霍夫变换的方法获得铭牌中的水平线段,通过计算得到线段的水平倾斜角,利用此倾角对图像进行还原。实验结果表明,该方法能快速地计算图像的倾斜角度,提高了OCR识别准确率且准确率可达95%以上。 展开更多
关键词 ocr 字符识别 霍夫变换 旋转矫正
下载PDF
印刷体藏文文字识别技术研究 被引量:12
5
作者 欧珠 普次仁 +3 位作者 大罗桑朗杰 赵栋才 刘芳 边巴旺堆 《计算机工程与应用》 CSCD 北大核心 2009年第24期165-169,172,共6页
藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于... 藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于网格的模糊笔划特征提取等。实验结果说明,这些方法可提高印刷体藏文文字识别系统的正确识别率和抗干扰能力。 展开更多
关键词 印刷体藏文字符 切分 藏文文字识别 光学字符识别
下载PDF
质心层次特征的无约束手写体数字识别 被引量:6
6
作者 吴雪菁 施鹏飞 《上海交通大学学报》 EI CAS CSCD 北大核心 1998年第9期31-34,共4页
光学字符识别(OCR)是模式识别最为成功的应用之一.目前,OCR的研究重点是无约束手写体字符识别.采用了基于字符质心的层次特征对无约束手写体数字进行分类识别.基于字符质心的不均匀分块方法,在一定程度上可以克服无约束手... 光学字符识别(OCR)是模式识别最为成功的应用之一.目前,OCR的研究重点是无约束手写体字符识别.采用了基于字符质心的层次特征对无约束手写体数字进行分类识别.基于字符质心的不均匀分块方法,在一定程度上可以克服无约束手写体数字字形千变万化所引起的不稳定性.层次特征将字符在空间的二维分布转化为一维,特征抽取过程简单,易于实现.将该算法应用于无约束手写体数字的信函分拣系统,单字的平均识别率达97%以上. 展开更多
关键词 光学字符识别 质心 层次特征 手写体数字识别
下载PDF
基于像素积分投影的印刷体维文字母切分方法 被引量:9
7
作者 李晓 袁保社 +2 位作者 陈卿 任宏宇 张建华 《计算机技术与发展》 2012年第4期41-44,49,共5页
维吾尔文字属于左向连写文字,字母之间的连笔与变形使得切分字母很困难,印刷体维吾尔文字母的准确切分是识别的关键。文中试验了一种基于像素积分投影的印刷体维吾尔文字母切分方法,包括使用行水平投影切出文字行与文字基线,通过垂直投... 维吾尔文字属于左向连写文字,字母之间的连笔与变形使得切分字母很困难,印刷体维吾尔文字母的准确切分是识别的关键。文中试验了一种基于像素积分投影的印刷体维吾尔文字母切分方法,包括使用行水平投影切出文字行与文字基线,通过垂直投影切出单词及单词中不粘连的字母,结合水平投影与垂直投影数据,外加相邻投影谷距、字母宽度与基线像素值等信息,设置了细化的连体段字母切分规则。实验结果表明,该方法能够较为准确的将印刷体维吾尔文字母切分开,为OCR系统的准确识别提供了基础。 展开更多
关键词 维吾尔文 印刷体 切分 像素投影积分 光学字符识别
下载PDF
基于OCR与词形状编码的英文扫描文档检索 被引量:7
8
作者 夏勇 戴汝为 +1 位作者 肖柏华 王春恒 《模式识别与人工智能》 EI CSCD 北大核心 2009年第3期488-493,共6页
分析当前常用的两类扫描文档检索方法:基于OCR和基于词形状编码的方法.提出基于识别信度将两种方法进行有机结合的思路.基于文档排字特性和笔画特征,还提出一种词形状编码方法,对字体有较强的容忍性.针对各种标引方法进行关键词检索对... 分析当前常用的两类扫描文档检索方法:基于OCR和基于词形状编码的方法.提出基于识别信度将两种方法进行有机结合的思路.基于文档排字特性和笔画特征,还提出一种词形状编码方法,对字体有较强的容忍性.针对各种标引方法进行关键词检索对比实验,实验结果表明,本文方法性能较优越. 展开更多
关键词 词形状编码 光学字符识别(ocr) 识别信度评估 文档检索
原文传递
基于机器视觉的手写钢板号图像增强及矫正算法研究与应用 被引量:1
9
作者 徐宽广 何东隅 +2 位作者 韩冰 刘宇佳 李家栋 《计算机工程》 CAS CSCD 北大核心 2024年第4期350-356,共7页
钢板号的正确识别检查是实现生产线自动化生产的重要基础条件之一。近年来,许多生产线在备料位置配备了喷印机用于自动标记物料编号。喷印的字迹清晰且耐高温,在没有涂抹的情况下使用钢板号识别设备可以实现接近100%的识别率。然而,由... 钢板号的正确识别检查是实现生产线自动化生产的重要基础条件之一。近年来,许多生产线在备料位置配备了喷印机用于自动标记物料编号。喷印的字迹清晰且耐高温,在没有涂抹的情况下使用钢板号识别设备可以实现接近100%的识别率。然而,由于喷印设备故障或受限于资金和空间等原因,有时无法安装喷印设备,只能依赖人工手写的方式在钢板表面标记编号。与喷印编号相比,手写编号存在书写随意、连笔、字迹歪斜扭曲等复杂情况,这些因素限制了识别系统的准确性。鉴于识别效果较差,通常需要依赖人工目测来辅助识别,从而影响了物料跟踪自动化的实施效果。为了提升手写钢板号的识别效果,对传统机器学习光学字符识别(OCR)文本区域检测算法进行改进研究,并针对手写钢板号的特征,提出一种图像增强和扭曲矫正处理的算法。应用结果表明,该算法可以改善手写钢板号的图像质量和形状,提高识别的准确性。该研究旨在提升手写钢板号识别效果,以解决自动化生产中的难题。通过图像增强和矫正处理,使识别系统更好地处理手写钢板号,推动物料跟踪的自动化实施。 展开更多
关键词 光学字符识别 钢板号识别 手写ocr区域校正 ocr图像预处理 自动识别
下载PDF
基于特征点的汉字字体识别研究 被引量:7
10
作者 王恺 靳简明 +1 位作者 史广顺 王庆人 《电子与信息学报》 EI CSCD 北大核心 2008年第2期272-276,共5页
该文提出了整体分析法和个体分析法的概念,并在分析它们各自适用范围的基础上,指出个体分析法更适合于解决印刷体汉字字体识别。在此基础上,提出一种基于特征点的个体分析法来解决汉字字体识别问题,与以往方法相比,该方法具有3个优点:... 该文提出了整体分析法和个体分析法的概念,并在分析它们各自适用范围的基础上,指出个体分析法更适合于解决印刷体汉字字体识别。在此基础上,提出一种基于特征点的个体分析法来解决汉字字体识别问题,与以往方法相比,该方法具有3个优点:识别可信度可控;处理速度快;适用于多语混排情况。实验结果表明,该方法有效解决了印刷体汉字字体识别问题,其性能大大优于以往方法。 展开更多
关键词 字体识别 光学字符识别 特征点
下载PDF
低对比度图像的自适应阈值化算法 被引量:3
11
作者 杨波 叶俊勇 +1 位作者 汪同庆 彭健 《传感器技术》 CSCD 北大核心 2002年第6期34-36,共3页
在处理光照不均匀的图像分割时用常用的阈值分割方法不能得到良好的分割效果。提出通过小波多分辨力滤波将滤波以后的低通图像作为图像的自适应阈值进行二值化 ,获得了比较理想的效果。该算法在枪支在线OCR识别系统中得到实际应用。
关键词 图像 自适应阈值化算法 小波多分辨力滤波 二值化 光学字符识别
下载PDF
基于机器视觉的封印产品字符编码检测系统 被引量:7
12
作者 李博 李仕奇 谭振豪 《现代制造工程》 CSCD 北大核心 2013年第6期88-91,共4页
介绍了应用机器视觉技术开发的封印产品字符编码检测系统,采用虚拟仪器开发平台LabVIEW完成系统的软件开发,实现了封印产品字符编码的自动识别及顺序检验,取代以往的人工目检。提出了一种基于ROI智能调整及多模板匹配的字符识别方法,有... 介绍了应用机器视觉技术开发的封印产品字符编码检测系统,采用虚拟仪器开发平台LabVIEW完成系统的软件开发,实现了封印产品字符编码的自动识别及顺序检验,取代以往的人工目检。提出了一种基于ROI智能调整及多模板匹配的字符识别方法,有效提高了封印产品字符编码检测的成功率。实践证明该系统在检测精度、效率和稳定性上满足大批量生产的要求。 展开更多
关键词 封印 字符识别 机器视觉
下载PDF
基于多元特征异构集成深度学习的图像识别模型及其应用 被引量:2
13
作者 汤健 田昊 +3 位作者 夏恒 王子轩 徐喆 韩红桂 《北京工业大学学报》 CAS CSCD 北大核心 2024年第1期27-37,共11页
随着城市矿产资源循环利用技术的不断发展,废旧手机回收已成为当前研究热点。受限于计算资源和数据资源的相对缺乏,目前基于线下智能回收装备的废旧手机识别精度难以达到实际应用。针对上述问题,提出一种基于多元特征异构集成深度学习... 随着城市矿产资源循环利用技术的不断发展,废旧手机回收已成为当前研究热点。受限于计算资源和数据资源的相对缺乏,目前基于线下智能回收装备的废旧手机识别精度难以达到实际应用。针对上述问题,提出一种基于多元特征异构集成深度学习的图像识别模型。首先,利用字符级文本检测算法(character region awareness for text detection,CRAFT)提取手机背部字符区域,再利用ImageNet预训练的VGG19模型作为图像特征嵌入模型,利用迁移学习理念提取待回收手机的局部字符特征和全局图像特征;然后,利用局部特征构建神经网络模式光学字符识别(optical character recognition,OCR)模型,利用全局和局部特征构建非神经网络模式深度森林分类(deep forest classification,DFC)模型;最后,将异构OCR和DFC识别模型输出的结果与向量组合后输入Softmax进行集成,基于权重向量得分最大准则获取最终识别结果。基于废旧手机回收装备的真实图像验证了所提方法的有效性。 展开更多
关键词 废旧手机 图像识别 迁移学习 多元特征 ocr 深度森林 异构集成
下载PDF
多字体字符识别的分级协同模型 被引量:3
14
作者 王海龙 戚飞虎 任庆生 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第2期184-187,共4页
提出了一种用于多字体字符识别的分级协同神经网络模型 .该分级模型的识别由两部分组成 :Haken的协同网络确定识别进入哪个协同子网 ;用协同子网进行具体识别 .对大量实际采集得到的多字体字符样本的测试表明 :新模型能有效地提高协同... 提出了一种用于多字体字符识别的分级协同神经网络模型 .该分级模型的识别由两部分组成 :Haken的协同网络确定识别进入哪个协同子网 ;用协同子网进行具体识别 .对大量实际采集得到的多字体字符样本的测试表明 :新模型能有效地提高协同神经网络对多字体字符的识别率 ,但由于仍保留了识别速度快的特点 ,所以新模型适用于实时的光学字符识别应用 .对加噪字符的识别试验表明该模型具有很好的鲁棒性 . 展开更多
关键词 协同神经网络 多字体字符识别 分级协同模型 协同子网 光学字符识别
下载PDF
基于OCR模型的通信机房图片归档系统设计 被引量:2
15
作者 周延熙 《信息与电脑》 2024年第1期125-127,共3页
目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字... 目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字信息,分析图片所属的机房位置,进而按照机柜位置分类归档图片,实现自动化管理。经过测试,该系统的归档准确率达到了98%以上,显著提高了通信机房图片归档的效率。 展开更多
关键词 图片归档系统 光学字符识别(ocr) 通信机房
下载PDF
基于RBF的纸币序列号识别方法 被引量:4
16
作者 阮雷 叶玉堂 +1 位作者 王鼎元 陈振龙 《电子设计工程》 2010年第9期51-54,共4页
序列号识别是金融安全领域的一个重要步骤。针对纸币序列号的字符特点,提出了一种基于径向基函数神经网络模型(RBF)的光学字符识别方法。使用工业相机,采集得到纸币图像,并进行必要的预处理,得到序列号区域的二值图像。再根据连通区域... 序列号识别是金融安全领域的一个重要步骤。针对纸币序列号的字符特点,提出了一种基于径向基函数神经网络模型(RBF)的光学字符识别方法。使用工业相机,采集得到纸币图像,并进行必要的预处理,得到序列号区域的二值图像。再根据连通区域信息对单个字符进行分割并归一化,然后提取字符的二维空间分布信息作为特征向量,并结合径向基函数神经网络进行字符识别。实验证明,该神经网络仅两层隐藏层,结构简单,在小样本集下可达到95%的识别率,并且训练时间在100 ms量级,能够很好地满足纸币序列号识别功能的要求。 展开更多
关键词 光学字符识别(ocr) 径向基函数 神经网络 特征提取
下载PDF
用于文本区域提取的边缘像素聚类方法 被引量:6
17
作者 付慧 刘峡壁 贾云得 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第5期729-734,共6页
根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数... 根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数,可提高字符分割等后续处理的计算效率.实验结果表明,该方法对文本区域提取是有效的,提取完整率达99%. 展开更多
关键词 文本区域提取 图像检索 光学字符识别 聚类 图像二值化
下载PDF
智能移动终端涉密信息监测系统 被引量:4
18
作者 王本钰 顾益军 彭舒凡 《科学技术与工程》 北大核心 2022年第6期2317-2325,共9页
网络高度发达的信息时代,防止涉密信息被泄露是一件非常重要的任务,尤其是对于政府、军队、公安等重点单位。传统的涉密信息监测系统往往是安装在主机等终端中,无法对于通过手机等智能移动终端偷拍涉密图片或者通过聊天软件上传涉密图... 网络高度发达的信息时代,防止涉密信息被泄露是一件非常重要的任务,尤其是对于政府、军队、公安等重点单位。传统的涉密信息监测系统往往是安装在主机等终端中,无法对于通过手机等智能移动终端偷拍涉密图片或者通过聊天软件上传涉密图片的行为无法进行有效的制止。针对这个问题,设计了一种将CTPN文本检测算法、光学字符识别技术(optical character recognition,OCR)与场景识别、图片传输监控相结合的智能移动终端涉密信息监测系统,可广泛应用于Android移动平台中。该系统通过全局扫描,实时相机监察,社交管控三防一体对失泄密行为进行监控监察,有效防止失泄密事故案件的发生。测试结果显示,该系统不仅可以准确识别涉密图片、监测涉密行为并且处理速度快、占用内存空间小,可以满足涉密单位的基本需求。 展开更多
关键词 CTPN文本检测算法 光学字符识别技术(optical character recognition ocr) 智能移动终端 监控监察
下载PDF
基于LabVIEW的多表位数字温湿度计图像识别系统设计 被引量:3
19
作者 闵琪涛 周逸 +3 位作者 潘永杲 姚建 李峻 缪文娇 《计量与测试技术》 2023年第3期30-32,35,共4页
针对数字温湿度计校准需求量大、校准时间长的实际情况,本文基于LabVIEW开发平台,设计了适用于超过20表位的数字温度计的图像识别系统。通过图像采集、提取和处理进行字符训练,形成标准字符集,并通过调用,实现对不同型号的数字温湿度计... 针对数字温湿度计校准需求量大、校准时间长的实际情况,本文基于LabVIEW开发平台,设计了适用于超过20表位的数字温度计的图像识别系统。通过图像采集、提取和处理进行字符训练,形成标准字符集,并通过调用,实现对不同型号的数字温湿度计温度和湿度的字符自动识别。 展开更多
关键词 图像识别 LABVIEW 数字温湿度计 字符训练 光学字符识别(ocr)
下载PDF
支票大写金额的印刷体与手写体辨识
20
作者 朱宁波 娄震 杨静宇 《计算机工程》 CAS CSCD 北大核心 2003年第9期143-146,共4页
针对银行支票大写金额识别工作中的手写体和印刷体辨识,抽取了4组分类特征,较好地体现了印刷体字符和手写体字符的区别。并且在构造分类器时,介绍了求取各分类特征对识别结果影响大小的权值向量的方法。在银行提供的大量真实票据上... 针对银行支票大写金额识别工作中的手写体和印刷体辨识,抽取了4组分类特征,较好地体现了印刷体字符和手写体字符的区别。并且在构造分类器时,介绍了求取各分类特征对识别结果影响大小的权值向量的方法。在银行提供的大量真实票据上进行了验证,并且应用于实际的银行自动支票处理系统,取得了很好的效果。 展开更多
关键词 ocr 印刷体 手写体 分类特征
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部