期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
OCR文字识别技术的研究 被引量:47
1
作者 张婷婷 马明栋 王得玉 《计算机技术与发展》 2020年第4期85-88,共4页
图像中的文字在当下相机高速发展下显得尤为重要,人们开始通过拍摄照片直接进行图像上文字的识别,最常用的就是寄快递收寄地址的识别。其中用到的技术是OCR(optical character recognition)字符识别技术,其中文名字叫做光学字符识别。... 图像中的文字在当下相机高速发展下显得尤为重要,人们开始通过拍摄照片直接进行图像上文字的识别,最常用的就是寄快递收寄地址的识别。其中用到的技术是OCR(optical character recognition)字符识别技术,其中文名字叫做光学字符识别。它是利用光学技术和计算机技术通过检测字符每个像素的暗、亮模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。随着日常生活网络化的推进,各种纸质文档的数字化智能化识别进程也在加速。经过二十世纪九十年代的发展,对字符识别技术的研究已经取得了很大的进展,市场上目前正在使用的各种OCR识别软件层出不穷。但是以往对证件的识别是一个比较大的难题。文中的研究主要是对普通的文字进行识别。识别系统包括三个模块:图像预处理、图像分割、字符识别。前两个模块又包含图像的二值化分析、灰度化等,对其进行了描述。 展开更多
关键词 ocr 文字识别 post方法 图像处理
下载PDF
基于学习的OCR字符识别 被引量:21
2
作者 肖坚 《计算机时代》 2018年第7期48-51,共4页
OCR(Optical Character Recognition)是通过检测字符每个像素亮度的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。文章利用Java语言实现OCR步骤,包括像素二值化,图像分割,训练识别和输出等。测试开发是在web验证码... OCR(Optical Character Recognition)是通过检测字符每个像素亮度的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。文章利用Java语言实现OCR步骤,包括像素二值化,图像分割,训练识别和输出等。测试开发是在web验证码识别场景中进行的,web验证码是将一串随机产生的符号,生成为图片,再加上一些干扰线,使之能有效防止恶意注册和灌水。通过测试表明,该方法可行、有效;拒识率、误识率低;识别速度快,具有一定的实用意义。 展开更多
关键词 ocr 验证码 文字识别 干扰线 拒识率 误识率
下载PDF
基于Android的手机OCR识别技术设计与实现 被引量:18
3
作者 朱怀中 《电子科技》 2012年第9期45-48,51,共5页
介绍了OCR文字处理和识别的工作原理,以及OCR运用在手机平台的优越性。设计了基于Android的OCR中英文识别日程小秘书软件,重点对OCR识别软件的功能进行分析,并设计实现方案,最终完成了OCR日程提醒功能。经过对软件系统功能的测试,结果表... 介绍了OCR文字处理和识别的工作原理,以及OCR运用在手机平台的优越性。设计了基于Android的OCR中英文识别日程小秘书软件,重点对OCR识别软件的功能进行分析,并设计实现方案,最终完成了OCR日程提醒功能。经过对软件系统功能的测试,结果表明,OCR识别软件在功能上能完成日常的文字识别与提取。 展开更多
关键词 ANDROID ocr 日程提醒 文字识别
下载PDF
Android图文同步识别系统的设计和实现 被引量:14
4
作者 刘淼 杨镇豪 +2 位作者 谢韵玲 谢冬青 唐春明 《计算机工程与设计》 CSCD 北大核心 2014年第6期2207-2213,共7页
针对开源识别引擎Tesseract-OCR对噪点多、亮度不均匀及规格不统一的图像识别效果不佳的情况,设计和实现了一种基于Android平台,能大幅度提高质量不高图像识别率的图文同步识别系统。实现了预览同步识别、联网上传识别、图像批量识别等... 针对开源识别引擎Tesseract-OCR对噪点多、亮度不均匀及规格不统一的图像识别效果不佳的情况,设计和实现了一种基于Android平台,能大幅度提高质量不高图像识别率的图文同步识别系统。实现了预览同步识别、联网上传识别、图像批量识别等功能,通过对图像进行消噪、亮度均衡及阈值分割等质量增强算法处理,提高了图像的最终识别率。新颖的同步识别模式有别于传统的图文识别软件,使用户在预览图像时能够即时看到识别效果,给使用者带来一种全新的用户体验。 展开更多
关键词 ANDROID应用 Tesseract-ocr 图像处理 同步识别 文字识别 识别系统
下载PDF
基于BP神经网络的车牌字符自动识别方法的研究 被引量:4
5
作者 关山 王伟杰 赵学增 《东北电力学院学报》 2004年第4期56-60,共5页
对基于人工神经网络的文字识别(OCR)进行了深入的研究,给出了用于车辆牌照识别特征的提取方法,构建了一个三层BP网络用于识别。实验结果表明,该方法简单,识别率高,对噪声不敏感,可推广到多种OCR识别中。
关键词 字符 文字识别 ocr识别 识别率 BP神经网络 车牌 车辆牌照 构建 实验结果 敏感
下载PDF
文档识别中误切分字符拒识问题的研究 被引量:6
6
作者 陈臻刚 丁晓青 +1 位作者 刘长松 彭良瑞 《计算机工程与应用》 CSCD 北大核心 2002年第17期69-72,共4页
自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广... 自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广义置信度,在此基础上改进了常用的广义置信度映射函数,并设计了一个基于样本学习的拒识规则,提高了拒识算法的适应性。在中日韩三种文档样本上的实验表明,该文算法明显改善了系统性能,对于较低质量的印刷文本识别具有一定的普遍意义。 展开更多
关键词 文档识别 误切分字符拒识问题 字符识别 置信度 拒识规则
下载PDF
基于笔画段分割和组合的汉字笔画提取模型 被引量:9
7
作者 陈睿 唐雁 邱玉辉 《计算机科学》 CSCD 北大核心 2003年第10期74-77,共4页
1.介绍 在过去的几十年中,学术界提出了大量的汉字手写体离线识别技术.这些技术主要可以分为两类,一类是基于整体形态的识别技术,如中心投影变换等;另一类是基于笔画和字根的识别技术.
关键词 汉字笔画提取模型 笔画段分割 笔画段组合 汉字识别 汉字结构
下载PDF
小类别数手写汉字识别 被引量:5
8
作者 薛炳如 杨静宇 +1 位作者 胡钟山 娄震 《计算机研究与发展》 EI CSCD 北大核心 2000年第4期483-492,共10页
针对小类别数手写汉字 ,在骨架图形的基础上 ,把手写汉字看作孤枝、孤环和部件的集合 ,并定义三者之间的方位关系 ,从而建立手写汉字的数学模型 .基于这种模型 ,进一步探讨一种新的识别方法以及新方法所使用的知识库的构造方法 .实验表... 针对小类别数手写汉字 ,在骨架图形的基础上 ,把手写汉字看作孤枝、孤环和部件的集合 ,并定义三者之间的方位关系 ,从而建立手写汉字的数学模型 .基于这种模型 ,进一步探讨一种新的识别方法以及新方法所使用的知识库的构造方法 .实验表明 。 展开更多
关键词 ocr 字符识别 手写汉字识别 数学模型
下载PDF
英文光学字符识别的后处理 被引量:7
9
作者 吕学强 迟呈英 《鞍山钢铁学院学报》 2002年第3期192-196,共5页
总结了英文光学字符识别 (OCR)系统中的常见错误类型 ,论证了使用拼写检查技术发现错误的可能性 .以最相似单词替换OCR的错误输出 ,从而达到改正错误的目的 .利用编辑距离实现词汇相似性评估 ,并用动态规划技术优化了编辑距离的计算 .... 总结了英文光学字符识别 (OCR)系统中的常见错误类型 ,论证了使用拼写检查技术发现错误的可能性 .以最相似单词替换OCR的错误输出 ,从而达到改正错误的目的 .利用编辑距离实现词汇相似性评估 ,并用动态规划技术优化了编辑距离的计算 .试验结果证明该方法可以使OCR系统的单词识别率提高 6 2 5 % . 展开更多
关键词 英文光学字符识别 后处理 拼写检查 编辑距离 字符识别率 单词识别率
下载PDF
基于OCR的字符识别的研究与实现 被引量:9
10
作者 李霄霄 《科技视界》 2017年第14期98-98,119,共2页
本文介绍了汉字OCR的原理、并对字符识别作了解释与研究,提出一种基于OCR识别的文字识别方法,在对文字信息、图像显示以及校正过程提出了自己的算法,对文字结构及读写方法进行了分析。试验表明该方法具有很快的计算速率,透过试验可以使... 本文介绍了汉字OCR的原理、并对字符识别作了解释与研究,提出一种基于OCR识别的文字识别方法,在对文字信息、图像显示以及校正过程提出了自己的算法,对文字结构及读写方法进行了分析。试验表明该方法具有很快的计算速率,透过试验可以使差错率控制在很低。 展开更多
关键词 ocr 文字处理 字符识别
下载PDF
信函自动分拣软件系统 被引量:2
11
作者 黄磊 刘昌平 《计算机工程与应用》 CSCD 北大核心 2003年第19期21-24,50,共5页
该文详细介绍了信函分拣系统软件部分以及在实现过程中所采用的具体方法,包括图像预处理、邮编定位与识别、版面分析和版面理解、单字分割及后处理等各个过程。系统采用了邮政编码与地址相互校正的分拣方法,有效地提高了分拣率。系统正... 该文详细介绍了信函分拣系统软件部分以及在实现过程中所采用的具体方法,包括图像预处理、邮编定位与识别、版面分析和版面理解、单字分割及后处理等各个过程。系统采用了邮政编码与地址相互校正的分拣方法,有效地提高了分拣率。系统正在某地进行试点,取得了较好的效果。 展开更多
关键词 信函自动分拣 ocr 版面分析与理解 手写识别
下载PDF
Automated Extraction and Analysis of CBC Test from Scanned Images
12
作者 Iman S. Alansari 《Journal of Software Engineering and Applications》 2024年第2期129-141,共13页
Health care is an important part of human life and is a right for everyone. One of the most basic human rights is to receive health care whenever they need it. However, this is simply not an option for everyone due to... Health care is an important part of human life and is a right for everyone. One of the most basic human rights is to receive health care whenever they need it. However, this is simply not an option for everyone due to the social conditions in which some communities live and not everyone has access to it. This paper aims to serve as a reference point and guide for users who are interested in monitoring their health, particularly their blood analysis to be aware of their health condition in an easy way. This study introduces an algorithmic approach for extracting and analyzing Complete Blood Count (CBC) parameters from scanned images. The algorithm employs Optical Character Recognition (OCR) technology to process images containing tabular data, specifically targeting CBC parameter tables. Upon image processing, the algorithm extracts data and identifies CBC parameters and their corresponding values. It evaluates the status (High, Low, or Normal) of each parameter and subsequently presents evaluations, and any potential diagnoses. The primary objective is to automate the extraction and evaluation of CBC parameters, aiding healthcare professionals in swiftly assessing blood analysis results. The algorithmic framework aims to streamline the interpretation of CBC tests, potentially improving efficiency and accuracy in clinical diagnostics. 展开更多
关键词 Image Processing Optical character recognition Tesseract ocr Health Care Application
下载PDF
联机手写笔画特征抽取的逼近-合并算法 被引量:2
13
作者 郑胜林 潘保昌 +1 位作者 赵学军 陈箫枫 《计算机工程与设计》 CSCD 北大核心 2006年第7期1248-1250,共3页
为了对联机手写字符识别的笔画进行精确描述,提出了一种基于字符笔画特征抽取的“逼近-合并”算法。该算法分析了字符笔画的多边形逼近,求出偏离度最小的多边形逼近,并对该多边形的边进行合并,抽取出笔画方向码,实现了联机手写字符笔画... 为了对联机手写字符识别的笔画进行精确描述,提出了一种基于字符笔画特征抽取的“逼近-合并”算法。该算法分析了字符笔画的多边形逼近,求出偏离度最小的多边形逼近,并对该多边形的边进行合并,抽取出笔画方向码,实现了联机手写字符笔画的更有效合并。该方法应用在联机手写体字符识别实验系统中,其识别率为99.13%。 展开更多
关键词 文字识别 特征抽取 多边形逼近 模式识别 图像处理 ocr
下载PDF
地方高校红色文献建设与数字化研究——以榆林学院绥德师范校区为例 被引量:2
14
作者 李金 张玲 +1 位作者 费晶 张馨月 《文化创新比较研究》 2023年第2期154-157,共4页
借助榆林学院绥德师范校区独特的红色文化优势,收集整理在革命战争年代留存的许多珍贵的红色文献,建设绥德师范校区红色资源馆藏库和数字研究平台,不仅是保护红色文献资源的需要,也是大数据时代科学研究的需要。该文阐述了绥德师范校区... 借助榆林学院绥德师范校区独特的红色文化优势,收集整理在革命战争年代留存的许多珍贵的红色文献,建设绥德师范校区红色资源馆藏库和数字研究平台,不仅是保护红色文献资源的需要,也是大数据时代科学研究的需要。该文阐述了绥德师范校区红色文献的收集整理方法,研究了国内红色文献数字化加工技术,提出了绥德师范校区红色文献的数字化方案和实施流程,以期为高校图书馆进行红色文献保护提供参考。 展开更多
关键词 绥德师范 红色文献 数字化 ocr文字识别
下载PDF
基于Tesseract-OCR的字符识别技术在特定场合的应用 被引量:6
15
作者 吴鸣 《湖南城市学院学报(自然科学版)》 CAS 2020年第5期58-61,共4页
基于谷歌开源OCR引擎Tesseract的字符识别技术,针对某特定应用场合,设计并实现了一个图片字符识别系统.首先,对尺寸一致的样本图片进行分割、灰度化和二值化预处理;其次,利用Tesseract对特定字符进行针对性的训练以提高字符识别率;最后... 基于谷歌开源OCR引擎Tesseract的字符识别技术,针对某特定应用场合,设计并实现了一个图片字符识别系统.首先,对尺寸一致的样本图片进行分割、灰度化和二值化预处理;其次,利用Tesseract对特定字符进行针对性的训练以提高字符识别率;最后,进行字符的识别和矫正.Python环境下的实验验证结果表明:经过训练后的Tesseract字库可以有效地提高字符识别的准确率和识别速度;同时,灰度图比二值图更适合本特定场合的图片字符识别. 展开更多
关键词 字符识别 ocr Tesseract 灰度图 二值图
下载PDF
基于Halcon的刹车片字符检测算法研究 被引量:5
16
作者 马艳宁 陈晓荣 张运涛 《电子科技》 2016年第10期101-103,共3页
针对人工检测刹车片字符时低效率的现状,提出一种基于机器视觉软件Halcon的字符检测算法。该算法在光照不均匀的条件下,充分利用了刹车片的外形特征,通过数幅图像测试后确定合适的分割方法和最佳阈值,定位出感兴趣区域(字符区域),通过... 针对人工检测刹车片字符时低效率的现状,提出一种基于机器视觉软件Halcon的字符检测算法。该算法在光照不均匀的条件下,充分利用了刹车片的外形特征,通过数幅图像测试后确定合适的分割方法和最佳阈值,定位出感兴趣区域(字符区域),通过适度膨胀解决字符断裂的难题,并特别处理了易发生混淆的I和1,测试图像达到了96%的识别率。结果表明,该算法可高效准确地识别出刹车片字符,且具有较高的实用价值。 展开更多
关键词 字符识别 HALCON 阈值分割 字符断裂 ocr
下载PDF
基于OCR模型的医疗救治装备数据采集平台设计与实现
17
作者 房珂宇 张鑫 +2 位作者 王钧钧 秦晓丽 陈平 《医疗卫生装备》 CAS 2024年第9期14-20,共7页
目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberr... 目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberry Pi 4B作为边缘节点,使用视频采集卡、摄像头、平板计算机等搭建硬件环境。其次,基于卷积循环神经网络(convolutional recurrent neural network,CRNN)优化OCR模型,通过软硬件协同方式实现医疗终端视频流处理与数据提取。最后,采用FineBI工具实现交互界面设计与数据库链接。结果:经实验验证,该平台的硬件环境可靠、稳定,优化后的OCR模型文本识别准确率提升,且采用该平台能够实现对医疗设备数据的快速、自动化采集。结论:采用该平台能够为医护人员提供全面、准确的医疗救治装备数据支撑,有利于提升医疗救治效率。 展开更多
关键词 ocr 应急医疗救援 医疗救治装备 数据采集
下载PDF
印刷体汉字识别后处理方法的研究 被引量:4
18
作者 张宏涛 龙翀 +1 位作者 朱小燕 孙俊 《中文信息学报》 CSCD 北大核心 2009年第6期67-71,共5页
高阶N-gram语言模型在OCR后处理方面有着广泛的应用,但也面临着因模型复杂度大导致的数据稀疏,以及耗费较多的时空资源等问题。该文针对印刷体汉字识别的后处理,提出了一种基于字节的语言模型的后处理算法。通过采用字节作为语言模型的... 高阶N-gram语言模型在OCR后处理方面有着广泛的应用,但也面临着因模型复杂度大导致的数据稀疏,以及耗费较多的时空资源等问题。该文针对印刷体汉字识别的后处理,提出了一种基于字节的语言模型的后处理算法。通过采用字节作为语言模型的基本表示单位,模型的复杂度大大降低,从而数据稀疏问题得到很大程度上缓解。实验证明,采用基于字节的语言模型的后处理系统能够以极少的时空开销获取很好的识别性能。在有部分分割错误的测试集上,正确率从88.67%提高到了98.32%,错误率下降了85.18%,运行速度较基于字以及基于词的系统有了大幅的提升,提高了后处理系统的综合性能;与目前常用的基于词的语言模型后处理系统相比,新系统能够节省95%的运行时间和98%的内存资源,但系统识别率仅降低了1.11%。 展开更多
关键词 计算机应用 中文信息处理 汉字识别 ocr 语言模型 后处理
下载PDF
粘连搭接字符切分方法研究 被引量:2
19
作者 安艳辉 董五洲 《河北师范大学学报(自然科学版)》 CAS 北大核心 2005年第2期137-140,共4页
字符切分是影响OCR系统识别的关键因素之一.对于中英文混排粘连搭接字符图像,提出了一种基于识别反馈的字符切分方法.该方法结构简单,容易实现,实验结果表明该方法有较好的切分效果.
关键词 字符切分 ocr系统 识别 图像 反馈 方法研究 粘连 效果 影响 实验结果
下载PDF
基于识别反馈的粘连字符切分方法研究 被引量:4
20
作者 安艳辉 董五洲 《河北省科学院学报》 CAS 2008年第2期32-35,共4页
字符切分是影响OCR系统识别的关键因素之一。对于中英文混排粘连字符图像,笔者提出了一种基于字符类别的识别反馈的字符切分方法。该方法结构简单,容易实现,实验结果表明该方法切分效果好。
关键词 ocr 字符切分 粘连字符 字符识别
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部