期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
文档识别中误切分字符拒识问题的研究 被引量:6
1
作者 陈臻刚 丁晓青 +1 位作者 刘长松 彭良瑞 《计算机工程与应用》 CSCD 北大核心 2002年第17期69-72,共4页
自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广... 自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广义置信度,在此基础上改进了常用的广义置信度映射函数,并设计了一个基于样本学习的拒识规则,提高了拒识算法的适应性。在中日韩三种文档样本上的实验表明,该文算法明显改善了系统性能,对于较低质量的印刷文本识别具有一定的普遍意义。 展开更多
关键词 文档识别 误切分字符拒识问题 字符识别 置信度 拒识规则
下载PDF
一种统计特征点网格分布的表格图像识别方法 被引量:5
2
作者 李海涛 柳健明 +1 位作者 德烈 张小惠 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第9期60-63,共4页
提出一种统计特征点网格分布的表格图像识别方法 ,该方法以表格框线间的交叉点类型作为表格分类的主要结构特征 ,把表格图像外接矩形区域归一化为N×N的网格 ,并统计每一网格内各种类型特征点的分布情况 ,由此形成的N×N个向量... 提出一种统计特征点网格分布的表格图像识别方法 ,该方法以表格框线间的交叉点类型作为表格分类的主要结构特征 ,把表格图像外接矩形区域归一化为N×N的网格 ,并统计每一网格内各种类型特征点的分布情况 ,由此形成的N×N个向量作为表格识别的特征向量 .采用了类似度的方法作为表格分类的判别准则 ,将未知表格类型的特征向量与预先经过学习建立的表格模板库中的标准特征向量进行相似性度量 ,取其类似度最高的模板类型作为识别结果 .实验表明该方法可行、高效 . 展开更多
关键词 统计特征点 网格分布 表格图像 图像识别 旋转校正 特征提取 类似度 文档识别
下载PDF
文档图像识别技术回顾与展望 被引量:6
3
作者 刘成林 《数据与计算发展前沿》 2019年第2期17-25,共9页
【目的】文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标。自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展。本文为科研人员... 【目的】文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标。自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展。本文为科研人员和工程人员提供一个比较全面的文档图像识别技术总体介绍,便于大家开展技术创新和技术应用。【方法】本文在介绍文档识别应用背景的基础上,对该领域历史上主要方法进行回顾,对当前技术状况和研究动态进行分析,并展望未来发展趋势。【结果】1950年代到2000年代,在统计模式识别、特征提取、结构分析、字符切分、字符串识别和版面分析等方面积累了大量有效方法。【结论】近年来深度学习(深度神经网络)逐渐成为主导性的方法,使文字检测和识别的性能得到明显提升,但在复杂版面分析能力、文字识别的可靠性、泛化性等方面仍然存在不足。 展开更多
关键词 文档识别 版面分析 文本检测 深度学习 字符识别 文本行识别
下载PDF
OCR技术在企业文档识别中的研究与实践 被引量:2
4
作者 王秀光 尹世阁 《信息与电脑》 2022年第18期175-178,共4页
本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务... 本文介绍了某轨道交通制造企业文档识别项目的建设背景、设计方案以及项目建设过程,利用先进的光学字符识别(Optical Character Recognition,OCR)技术提升了纸质文档管理效率,并总结和建立了企业的OCR平台的通用集成标准规范,使各业务系统所需录入文档能够在短时间内识别完成,并集成于OCR平台进行存储和管控,进而提升处理效率,在企业的研发、生产以及运营环节节省更多人力。 展开更多
关键词 光学字符识别(OCR)技术 企业 文档识别 文档要素抽取
下载PDF
安卓APP安全加固系统的分析与设计 被引量:3
5
作者 赵跃华 刘佳 《计算机工程》 CAS CSCD 北大核心 2018年第2期187-192,共6页
为提高Android应用软件的保护能力,以增加攻击者破解难度,同时不影响APP运行效率为目标,在APP说明文档自动识别的基础上,设计一套APP安全加固系统。通过对APP说明文档进行关键词的自动识别,进而由关键词确定其APP的安全需求,根据安全需... 为提高Android应用软件的保护能力,以增加攻击者破解难度,同时不影响APP运行效率为目标,在APP说明文档自动识别的基础上,设计一套APP安全加固系统。通过对APP说明文档进行关键词的自动识别,进而由关键词确定其APP的安全需求,根据安全需求给出对应的安全组合加固方案,实现具体的安全加固。分析结果表明,该系统能以合适的加固方案增加APP的安全性,有效保护了用户和开发者的合法利益。 展开更多
关键词 安卓系统 文档识别 关键词 应用安全 加固
下载PDF
基于融合特征与语法规则的流式文档理解方法 被引量:1
6
作者 郝海利 李宁 +1 位作者 田英爱 耿思 《北京信息科技大学学报(自然科学版)》 2019年第1期49-54,共6页
针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法。首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计... 针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法。首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计算,得出候选的构件标签;结合自顶向下和自底向上的结构识别方法,得到文档的逻辑结构。通过实验验证了该方法能有效提高文档构件识别的准确率,同时提高了文档结构识别的准确率。 展开更多
关键词 文档结构理解 文档识别 流式文档
下载PDF
文档识别及其在藏文古籍识别中的应用探讨
7
作者 李振江 《求知导刊》 2016年第35期63-64,共2页
文档识别技术能自动识别文档中的文本、图片、表框等信息,为纸质文档的全文数字化提供了便利。文章分析了文档识别过程中预处理、版面分析、行字切分、特征提取以及分类的流程,对文档识别技术的发展做了一个简单的综述,并结合藏文古... 文档识别技术能自动识别文档中的文本、图片、表框等信息,为纸质文档的全文数字化提供了便利。文章分析了文档识别过程中预处理、版面分析、行字切分、特征提取以及分类的流程,对文档识别技术的发展做了一个简单的综述,并结合藏文古籍识别的具体应用,对该技术在藏文古籍识别方面的应用难点进行了探讨。 展开更多
关键词 文档识别 版面分析 藏文古籍
下载PDF
多层神经网络
8
《计算机应用:英文版》 2005年第3期35-36,共2页
Adaptive critic neural network-based controller for nonlinear systems;ADAPTIVE CRITIC-BASED NEURAL NETWORK CONTROLLER FOR UNCERTAIN NONLINEAR SYSTEMS WITH UNKNOWN DEADZONES;An integrated neural network-based vision ... Adaptive critic neural network-based controller for nonlinear systems;ADAPTIVE CRITIC-BASED NEURAL NETWORK CONTROLLER FOR UNCERTAIN NONLINEAR SYSTEMS WITH UNKNOWN DEADZONES;An integrated neural network-based vision system for automated separation of clods from agricultural produce;An Integrated System for the Analysis and the Recognition of Characters in Ancient Documents;Contour extraction of left ventricular cavity from digital subtraction angiograms using a neural edge detector;Direct MNN Control of Continuous Stirred Tank Reactor Based on Input-Output Model;DISTINCTIVE PHONETIC FEATURE EXTRACTION FOR ROBUST SPEECH RECOGNITION。 展开更多
关键词 多层神经网络 自动分离 文档识别 轮廓抽取
下载PDF
国内新闻
9
《中国印刷》 2007年第7期4-4,6,8,共3页
新闻出版总署发布《2006年全国新闻出版业基本情况》;多体蒙古文印刷文档识别平台通过鉴定;环保总局推新政策淘汰落后造纸工艺;《文化产品和服务出口指导目录》正式发布;我国首次将RFID技术应用于木质包装防伪。
关键词 新闻出版业 国内 RFID技术 文档识别 造纸工艺 环保总局 文化产品 包装防伪
下载PDF
表格图象处理技术及其在出入境部门的应用
10
作者 黄岳峰 《广东公安科技》 2004年第2期45-48,共4页
以表格图象处理的基本概念作为开端 ,介绍表格图象的特征和表格图象处理的研究现状 ,并且选取了一些具有代表性的表格图象处理的方法作详细介绍 ,最后结合本单位出入境部门的实际 ,谈谈表格图象处理技术在档案处理工作中的应用。
关键词 表格图象 图象处理 出入境管理 文档识别 档案处理
原文传递
印刷体英文文档识别系统的设计与实现 被引量:9
11
作者 尹芳 王卫兵 陈德运 《哈尔滨理工大学学报》 CAS 2008年第6期9-12,共4页
光学字符识别是模式识别领域的一个重要分支.提出并实现了一种用于印刷体英文文档的OCR系统.该系统使用基于字符识别的方法进行文档识别,图像经过预处理后,提取多种特征进行组合,并且考虑到字符粘连的情况,在训练样本中加入部分易粘连... 光学字符识别是模式识别领域的一个重要分支.提出并实现了一种用于印刷体英文文档的OCR系统.该系统使用基于字符识别的方法进行文档识别,图像经过预处理后,提取多种特征进行组合,并且考虑到字符粘连的情况,在训练样本中加入部分易粘连字母组合进行识别.通过实验证明,该识别系统快速、稳定且有效. 展开更多
关键词 英文文档识别 特征提取 特征组合
下载PDF
少数民族文字文本分析与识别的研究进展
12
作者 王维兰 胡金水 +8 位作者 魏宏喜 库尔班·吾布力 邵文苑 毕晓君 贺建军 李振江 丁凯 金连文 高良才 《中国图象图形学报》 CSCD 北大核心 2024年第6期1685-1713,共29页
对于少数民族古籍的保护与传承,国家予以高度重视,并强调了对这些不可再生文化资源透彻数字化的重要性。随着文档图像分析与识别技术的不断进步,对少数民族文字的文本分析与识别研究受到广泛关注,并取得显著成就,成为人工智能应用研究... 对于少数民族古籍的保护与传承,国家予以高度重视,并强调了对这些不可再生文化资源透彻数字化的重要性。随着文档图像分析与识别技术的不断进步,对少数民族文字的文本分析与识别研究受到广泛关注,并取得显著成就,成为人工智能应用研究的一个热点领域。然而,由于少数民族文字种类繁多、应用场景多样及数据集的稀缺性等问题,这一研究领域仍面临诸多挑战。本文旨在总结先前的工作,并为未来的研究提供支持,重点讨论了印刷体文本、联机手写、古籍文档及场景文字识别等任务,概述了国内外在少数民族文种识别领域的发展和最新成果。首先阐明了少数民族文字文本分析与识别的重要性及其价值,介绍了特定少数民族文字及其古籍文档的特征。然后,回顾了这一领域的发展历史和现状,分析并总结了传统方法的代表性成果及其应用;详细讨论了研究重点向深度神经网络模型和深度学习方法的全面转移,这一转变使得各文种的识别性能得到了显著提升。最后,基于相关分析,本文指出了在不同文种文档分析与识别中存在的精度和泛化能力等方面的不足,以及与汉文文本分析与识别的差异;面对少数民族文字文本识别领域的主要困难与挑战,展望了未来的研究趋势和技术发展目标。 展开更多
关键词 少数民族文字 文档分析与识别 印刷体文本识别 手写识别 古籍文档识别 场景文字识别
原文传递
浅谈文书档案数字化 被引量:6
13
作者 饶宗政 《四川档案》 北大核心 2002年第5期33-34,共2页
本文论述了文书档案数字化的概念、原则、方法和过程,着重讨论了影响档案数字化质量的三个重要参数:分辨率、亮度和扫描速度。
关键词 文书档案 数字化 扫描 人工键盘录入 语音识别 文档识别正确率
下载PDF
标书文档识别处理系统VHTender的设计与实现
14
作者 李佐 王姝华 +1 位作者 余波 蔡士杰 《计算机应用与软件》 CSCD 北大核心 2003年第2期21-22,80,共3页
本文介绍了英文标书文档处理系统VHTender的设计和实现过程,该系统能够从纸质标书的扫描图象中抽取文档信息将其转换成电子标书。本文从功能实现的角度,介绍了该系统在一些关键性技术中所采用的方法和策略。
关键词 标书文档识别处理系统 VHTender 设计 办公自动化系统 电子文档 字符识别 文档理解
下载PDF
人工智能在手写文档识别分析中的技术演进 被引量:1
15
作者 竺博 吴嘉嘉 +1 位作者 何春江 胡金水 《电子测试》 2019年第13期5-8,48,共5页
本文简要回顾手写文档识别和分析技术在过去十年的技术变化,对比各项主要技术的原理和性能,着重分析基于深度学习的神经网络方法在文档识别分析应用中所带来的显著效果提升。
关键词 手写识别 深度学习 文档识别分析
下载PDF
多字体印刷蒙古文文档识别系统基础资源的建设 被引量:1
16
作者 包艳花 《呼伦贝尔学院学报》 2012年第1期106-109,共4页
简述了研制"多字体印刷蒙古文(混排汉英)文档识别系统"过程中利用的基础资源的建设情况,包括样本库的建立、各类标准样本的建设、字符分库的建立等。
关键词 蒙古文文档识别系统 样本库 标准样本 字符分库
下载PDF
第13届文档分析与识别国际会议(英文)
17
《智能系统学报》 CSCD 北大核心 2015年第1期67-67,共1页
Welcome to the 13th International Conference on Document Analysis and Recognition(ICDAR 2015),hosted by the REGIM-Lab.and the Association of Sustainable Innovation in Tunisia(Tunisian Chapter of IAPR),will be held in ... Welcome to the 13th International Conference on Document Analysis and Recognition(ICDAR 2015),hosted by the REGIM-Lab.and the Association of Sustainable Innovation in Tunisia(Tunisian Chapter of IAPR),will be held in Tunis(Tunisia)from August 23-26th,2015.ICDAR 2015 is sponsored by the International Association for Pattern Recognition(IAPR)and technically co-sponsored by TC-10(Graphics Recognition),TC-11(Reading Systems),IEEE Computer Society(pending approval)。 展开更多
关键词 文档分析 文档识别 技术创新 发展现状
下载PDF
文通参加中国少数民族语言文字工作成果展
18
《数码世界(A)》 2008年第1期15-15,共1页
2007岁末,中国少数民族语言文字工作成果展在北京民族大学举行,来自全国各地的少数民族语言文字工作者齐聚一堂,集中向社会各界展示了我国少数民族语言文字工作的优秀成果。清华信息科学与技术国家实验室携手北京文通信息技术有限公... 2007岁末,中国少数民族语言文字工作成果展在北京民族大学举行,来自全国各地的少数民族语言文字工作者齐聚一堂,集中向社会各界展示了我国少数民族语言文字工作的优秀成果。清华信息科学与技术国家实验室携手北京文通信息技术有限公司,共同参加了此次盛会,并在会议上展示了“统一平台少数民族文字(蒙藏维哈柯朝)文档识别综合系统”, 展开更多
关键词 少数民族文字 语言文字 成果展 中国 信息技术 国家实验室 科学与技术 文档识别
下载PDF
清华大学多体蒙古文印刷文档识别平台通过鉴定
19
《印刷杂志》 2007年第6期93-93,共1页
近日,由清华大学承担的多体蒙古文(混排汉英)印刷文档识别暨统一平台少数民族文字识别系统通过了教育部科技发展中心组织的鉴定。
关键词 文档识别 清华大学 蒙古文 鉴定 平台 印刷 多体 文字识别系统
下载PDF
VSM模型在文档结构识别中的应用 被引量:10
20
作者 宋昊苏 李宁 张伟 《北京信息科技大学学报(自然科学版)》 2011年第6期66-69,75,共5页
借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计... 借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计算,具有较好的扩展性,可在此基础上实现其他特定结构文档格式的自动检查或文档理解。 展开更多
关键词 文档结构识别 向量空间模型 文档格式校验 文档理解
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部