期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
中文OCR与图书资料的再制作 被引量:6
1
作者 任永芳 《高校图书馆工作》 2001年第3期42-44,共3页
中文 OCR是目前一项行之有效的方式 ,本文介绍了国内几个优秀的 OCR系统 ,分析其功能特征 ,希望能对图书馆的数字化工作有所帮助。同时 ,针对数字图书馆建设的新要求 ,对今后中文
关键词 中文ocr 文字识别系统 文献资源数字化 数字图书馆 汉王ocr录入工厂软件系统 清华文通TH-ocr
下载PDF
基于卷积神经网络的图像中文OCR识别纠错方法及系统的研究 被引量:7
2
作者 杜训祥 《江苏通信》 2021年第1期109-112,共4页
随着科学技术的发展,人工智能正越来越多地进入并改变着我们的日常生活。光学字符识别技术(Optical Character Recognition,OCR)是计算机视觉研究领域的分支之一,归属于人工智能。本文提出一种基于VGGNet深度学习卷积神经网络的图像中文... 随着科学技术的发展,人工智能正越来越多地进入并改变着我们的日常生活。光学字符识别技术(Optical Character Recognition,OCR)是计算机视觉研究领域的分支之一,归属于人工智能。本文提出一种基于VGGNet深度学习卷积神经网络的图像中文OCR识别纠错方法。首先,基于OCR业务系统平台生产中间数据,积累字、词数据,建立字、词图像库。其次,开发"字词图像库汇总工具",汇总字、词、建立字典,并实现字典与本地图像库一致性更新;接着使用三步数据处理法,将机器与人工相结合,对字、词库进行数据清洗,清除错误、合并相同,并建立常错字词映射表。然后,基于Tensorflow深度学习框架,训练VGGNet网络模型,建立字、词分类器。最后,对OCR结果进行分析,智能纠正错误结果。本文的方法,使中文OCR的准确度提高了10个百分点,同时数据清洗工作量减少了50%。 展开更多
关键词 卷积神经网络 中文ocr 数据清洗 图像分类
下载PDF
基于CRNN模型的中文场景文字识别 被引量:4
3
作者 辜双佳 栗智 《科技风》 2021年第17期108-110,共3页
中文场景文字识别(STR)是光学字符识别(OCR)技术的重要研究方向,在拍照翻译、无人驾驶等领域广泛应用。但是,中文场景下的文字面临着字体和字符种类多、文字背景复杂等问题。本文着眼于“中国街景”图像,基于CRNN模型提出了一种免分割... 中文场景文字识别(STR)是光学字符识别(OCR)技术的重要研究方向,在拍照翻译、无人驾驶等领域广泛应用。但是,中文场景下的文字面临着字体和字符种类多、文字背景复杂等问题。本文着眼于“中国街景”图像,基于CRNN模型提出了一种免分割、端到端的中文场景文字识别方法。首先CNN提取图像卷积特征,然后RNN进行序列特征预测,其中Bi-GRU有效抑制梯度消失或梯度爆炸,Dropout可以防止过拟合,最后引入CTC作为损失函数解决训练时字符无法对齐的问题。本文用Python实现了算法,以较好的效果完成了实验。 展开更多
关键词 中文ocr CRNN 免分割 端到端 中国街景
下载PDF
OCR:让文档输入更精彩——文档资料数字化的必由之路
4
作者 木永 《数码世界(A)》 2003年第11期32-34,共3页
无论采取何种方式进行图表、文字资料的数字化,都必须首先以图像的方式将文字资料从纸质媒体转换到电子媒体之中。而对于这类资料,最好的转化方式便是将其转化为文本信息,这样就可以方便地实现全文检索,并能够节省大量的存储空间。... 无论采取何种方式进行图表、文字资料的数字化,都必须首先以图像的方式将文字资料从纸质媒体转换到电子媒体之中。而对于这类资料,最好的转化方式便是将其转化为文本信息,这样就可以方便地实现全文检索,并能够节省大量的存储空间。在由图像到文本的转换过程中,主要依靠的便是OCR(光学字符识别)技术。 展开更多
关键词 ocr技术 光学字符识别技术 中文ocr 计算机 汉王ocr 识别率 WORD文档 校对功能 声音校对功能 文档资料数字化
下载PDF
中文OCR与图书资料的再制作 被引量:2
5
作者 任永芳 《江苏图书馆学报》 2001年第3期23-25,共3页
图书馆图书期刊的数字化处理是数字图书馆建设的一项重要工作 ,采用何种方式数字化堆积如山的馆藏资料需要考虑各方面的因素。中文OCR是目前一项行之有效的方式 ,本文介绍了国内几个优秀的OCR系统 ,分析其功能特征 ,希望能对图书馆的数... 图书馆图书期刊的数字化处理是数字图书馆建设的一项重要工作 ,采用何种方式数字化堆积如山的馆藏资料需要考虑各方面的因素。中文OCR是目前一项行之有效的方式 ,本文介绍了国内几个优秀的OCR系统 ,分析其功能特征 ,希望能对图书馆的数字化工作有所帮助。同时 ,针对数字图书馆建设的新要求 。 展开更多
关键词 中文ocr 数字图书馆 数字化处理 馆藏资料 手写古籍 简繁混排文本 文字识别系统
下载PDF
基于应用技术实现语言处理研究
6
作者 郭建伟 燕娜 陈佳宇 《中国科技信息》 2019年第1期56-57,共2页
目前,语言处理技术广泛应用在人们生活、学习和工作的各个方面,给人们带来了极大的方便。但是,无论是中文搜索技术,还是中文语音识别,或者中文OCR,相对英文来说都不太成熟。比如,在会计做账领域,"购买钢材一批50000元"对应的... 目前,语言处理技术广泛应用在人们生活、学习和工作的各个方面,给人们带来了极大的方便。但是,无论是中文搜索技术,还是中文语音识别,或者中文OCR,相对英文来说都不太成熟。比如,在会计做账领域,"购买钢材一批50000元"对应的是"借:库存材料5万贷:银行存款5万"。如果计算机技术的发展可以提供智能的做账软件,把经济业务输入进去以后,自动出分录、凭证和报表,这将会极大提高公司财务工作的效率,给相关人员的经济和财务决策提供智力和知识支持。 展开更多
关键词 搜索技术 语言处理 应用 中文语音识别 中文ocr 计算机技术 银行存款 财务工作
下载PDF
中文OCR与数字化图书馆建设
7
作者 邹素斌 《海峡科学》 2001年第S1期37-38,共2页
中文OCR是当今被人们广泛采用的一种文字输入方式。本文通过介绍和分析国内几种有代表性的OCR系统 ,针对它在数字化图书馆建设中的重要作用 。
关键词 中文ocr 数字化 数字化图书馆
下载PDF
基于Gabor函数的汉字字体识别 被引量:7
8
作者 许春晔 郭宝兰 《河北大学学报(自然科学版)》 CAS 2001年第2期167-170,190,共5页
汉字字体识别是当前中文OCR系统需进一步解决的问题之一 ,字体信息属于汉字笔画上的微细结构部分 ,抗干扰能力差 ,这样基于局部微细结构分析的方法是具有较大难度的 .这里采用了一种新的基于Gabor函数的全局纹理分析的识别方法 .在实验... 汉字字体识别是当前中文OCR系统需进一步解决的问题之一 ,字体信息属于汉字笔画上的微细结构部分 ,抗干扰能力差 ,这样基于局部微细结构分析的方法是具有较大难度的 .这里采用了一种新的基于Gabor函数的全局纹理分析的识别方法 .在实验中选用了汉字 4种常用标准印刷字体 (宋、仿宋、黑、楷 )的样张 ,以证实这种方法的有效性 . 展开更多
关键词 字体识别 GABOR滤波器 纹理分析 汉字识别 GABOR函数 中文ocr系统 纹理鉴别
下载PDF
中文OCR综述
9
《科技与出版》 CSSCI 北大核心 1997年第1期23-24,共2页
中文OCR综述北京清华文通信息技术公司目前,在广泛采用拼音、五笔、郑码、超想等键盘输入法之外,尚有一种通过扫描仪,大量、高速录入印刷汉字的自动录入方法,即中文OCR技术,以此大幅度提高办公效率。本文向广大读者介绍中文... 中文OCR综述北京清华文通信息技术公司目前,在广泛采用拼音、五笔、郑码、超想等键盘输入法之外,尚有一种通过扫描仪,大量、高速录入印刷汉字的自动录入方法,即中文OCR技术,以此大幅度提高办公效率。本文向广大读者介绍中文OCR技术的发展背景及OCR产品,... 展开更多
关键词 中文ocr技术 ocr产品 计算机 扫描仪 自动录入
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部