期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于有向单连通链的表格框线检测算法 被引量:23
1
作者 郑冶枫 刘长松 +1 位作者 丁晓青 潘世言 《软件学报》 EI CSCD 北大核心 2002年第4期790-796,共7页
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是... 表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求、实验证明,该算法具有速度较快、鲁棒性高、抗任意角度的倾斜、抗断裂等优点. 展开更多
关键词 表格识别 图像分析 光学字符识别 智能文档处理 表格框线检测算法 有向单连通链
下载PDF
一种表格框线检测和字线分离算法 被引量:11
2
作者 刘长松 潘世言 +1 位作者 郑冶枫 丁晓青 《电子与信息学报》 EI CSCD 北大核心 2002年第9期1190-1196,共7页
该文提出了一种基于有向单连通链的表格框线检测算法,能够合理地利用单连通链边沿的全局统计特性和单连通链之间的局部位置关系,精确地提取表格框线,具有抗倾斜,抗断裂,抗字线交叠等优点。在此基础上,提出了一种能够分离交叠字线的表格... 该文提出了一种基于有向单连通链的表格框线检测算法,能够合理地利用单连通链边沿的全局统计特性和单连通链之间的局部位置关系,精确地提取表格框线,具有抗倾斜,抗断裂,抗字线交叠等优点。在此基础上,提出了一种能够分离交叠字线的表格框线去除算法,并成功应用于实际的表格识别系统中。 展开更多
关键词 字线分离算法 表格识别 图像分析 直线检测 字符识别 有向单连通链
下载PDF
基于游程的倾斜表格图像的快速检测和校正 被引量:7
3
作者 管继斌 明德烈 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第8期69-71,共3页
基于表格自动录入系统中票据图像的自身特点,提出了一种基于游程的倾斜表格图像的快速检测及校正算法.通过对游程分布直方图的分析,检索出行最长游程组,根据行最长游程组的最大旋转角计算出表格图像倾斜的角度.基于实际表格图像倾斜角... 基于表格自动录入系统中票据图像的自身特点,提出了一种基于游程的倾斜表格图像的快速检测及校正算法.通过对游程分布直方图的分析,检索出行最长游程组,根据行最长游程组的最大旋转角计算出表格图像倾斜的角度.基于实际表格图像倾斜角度一般不会过大的特点,提出了基于线性搬移技术的校正方法,通过对行、列两个方向的分段线性搬移达到图像快速倾斜校正的目的.算法已应用于实际系统,测试结果表明该技术方法可行、鲁棒性强、并且具有较高的执行效率. 展开更多
关键词 图像识别 游程 倾斜检测 倾斜校正 表格识别
下载PDF
社区选举系统选票中的表格识别算法 被引量:7
4
作者 邝振 崔喆 《计算机应用》 CSCD 北大核心 2017年第A02期179-182,共4页
针对社区选举系统识别选票图像中的表格采用的同步道方法,造成选票设计复杂,需在系统中定义较多关于信息块位置信息的参数,和在印刷过程中出现表格位置偏差无法识别选票的问题,提出了先利用投影法确定表格中横纵直线的坐标,然后构造表... 针对社区选举系统识别选票图像中的表格采用的同步道方法,造成选票设计复杂,需在系统中定义较多关于信息块位置信息的参数,和在印刷过程中出现表格位置偏差无法识别选票的问题,提出了先利用投影法确定表格中横纵直线的坐标,然后构造表格特征点矩阵来描述表格结构的表格识别算法。实验结果表明,与采用同步道识别表格的方法相比,只需要在系统中指定信息块的相对位置信息,该算法即可通过识别出的选票表格中横纵直线坐标和构造的表格特征点矩阵准确并方便地提取出信息块的图像进行下一步的识别,简化了选票设计,降低了对选票印刷的要求,对表格位置出现偏差的选票也能够进行正常识别,进一步提升了选举系统的可操作性和容错性。 展开更多
关键词 表格识别 选举系统 投影法 表格结构 表格特征点矩阵
下载PDF
基于深度学习OCR的医疗设备质控检测原始记录表智能识别系统的设计与应用
5
作者 林艺文 《中国医疗设备》 2024年第9期54-61,共8页
目的为了提高纸质医疗设备质控检测原始记录表手写数据的电子化录入效率,替代传统手工录入方式,实现手写检测数据的批量化自动录入。方法基于Python语言,开发一套基于深度学习光学字符识别(Optical Character Recognition,OCR)的医疗设... 目的为了提高纸质医疗设备质控检测原始记录表手写数据的电子化录入效率,替代传统手工录入方式,实现手写检测数据的批量化自动录入。方法基于Python语言,开发一套基于深度学习光学字符识别(Optical Character Recognition,OCR)的医疗设备质控检测原始数据记录表智能识别系统。深度学习OCR技术采用百度智能云OCR云服务,实现批量识别质控检测记录表电子图片,获取结构化的检测数据识别结果,并将识别结果以电子表格的形式导出。结果该系统已实现8种常用医疗设备质控检测原始记录表的智能化识别,经实验测试,8种质控检测记录表平均识别耗时为5.45 s,平均识别正确率为95.94%。系统应用后,医疗设备质控检测原始记录表手写数据电子化录入用时显著低于传统手工录入方式,且差异有统计学意义(P<0.001)。结论该系统识别速度快,识别正确率高,实现了医疗设备质控检测原始记录表批量化、智能化、电子化自动录入,节省了大量人力,提高了质控检测数据整理效率,为质控检测数据的深度分析打下坚实基础。 展开更多
关键词 医疗设备质控 表格识别 光学字符识别 深度学习 质控记录表
下载PDF
利用数字影像中直线的结构特征检测直线段 被引量:3
6
作者 周绍光 辛莉 田林亚 《计算机工程与应用》 CSCD 北大核心 2004年第22期71-74,共4页
在数字影像中,理想的直线段由呈阶梯状排列的游程所构成。论文利用这一特征提出了一种检测直线段的新方法,它以逐行或逐列搜索带有缝隙的游程作为基础,搜索时能根据已取得的部分直线段预测下一段游程的起始像素位置,检测速度较快,获取... 在数字影像中,理想的直线段由呈阶梯状排列的游程所构成。论文利用这一特征提出了一种检测直线段的新方法,它以逐行或逐列搜索带有缝隙的游程作为基础,搜索时能根据已取得的部分直线段预测下一段游程的起始像素位置,检测速度较快,获取的直线段较长,所得结果非常适合于用作为基元以合并成完整的直线。该算法的原理还可用来快速确定表格框线的转角。 展开更多
关键词 直线检测 计算机视觉 表格识别 图像分析
下载PDF
手写表格识别系统研究和实现 被引量:5
7
作者 王行荣 应俊 《计算机科学》 CSCD 北大核心 2008年第6期268-271,共4页
对手写表格数字识别系统进行研究,提出了输出规则的概念,解决了常用表格数据识别处理的输出描述问题。用此方法已成功地开发出手写数字表格识别处理系统,该系统具有运算量小、抗干扰性强、通用性好、识别率高等特点。
关键词 手写数字识别 表格识别 输出规则 识别系统
下载PDF
基于OCR技术的航天器材料及器件试验数据识别系统 被引量:2
8
作者 陆俊杰 魏亚东 +3 位作者 李晓峰 王成 李洪普 李锋 《计算机测量与控制》 2023年第1期282-288,293,共8页
航天器材料及器件数据库需要海量国内外试验报告数据的支撑,其中表格作为最普遍的数据存储形式含有的数据量最为庞大,然而面对人工识别提取表格数据工作繁琐且易出错的难点,以PDF文档的表格为研究对象,提出基于OCR技术的航天器材料及器... 航天器材料及器件数据库需要海量国内外试验报告数据的支撑,其中表格作为最普遍的数据存储形式含有的数据量最为庞大,然而面对人工识别提取表格数据工作繁琐且易出错的难点,以PDF文档的表格为研究对象,提出基于OCR技术的航天器材料及器件试验数据识别系统;采用了B/S架构,基于EXT、JAVA、Python等技术语言进行开发,系统具备PDF文档转换、表格识别、数据提取、数据编辑等功能;依据系统设计采用版面分析和PDFPlumber表格检测的关键技术和方法以达导准确有效识别PDF文档表格的目的,采用EXT表格控件形式展现提取的数据经试验测试实现了对PDF文档内规整表格的批量识别和数据提取;验证了设计方案的可行性,满足了试验数据试别系统的高识别准确率、快速识别等特点。 展开更多
关键词 航天器材料与器件 数据识别系统 OCR PDF文档 表格识别
下载PDF
表格型票据中框线检测与去除算法 被引量:5
9
作者 张艳 郁生阳 +1 位作者 张重阳 杨静宇 《计算机研究与发展》 EI CSCD 北大核心 2008年第5期909-914,共6页
字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去... 字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去除算法,首先充分利用票据灰度图像的特点准确地检测出框线,再采用一种连通链结构描述叠加后的框线区域,然后对交叠进行判断和标记,根据标记保留字符笔划去除框线干扰.经过实际银行支票图像测试证明了算法的有效性和鲁棒性. 展开更多
关键词 文档分析 表格识别 直线检测 连通链结构 框线去除
下载PDF
基于字线分离的表格识别预处理算法 被引量:4
10
作者 刘为 平西建 郭戈 《计算机工程与设计》 CSCD 北大核心 2008年第19期5066-5068,共3页
表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构。提出了一种基于字线分离的预处理算法。该算法在不提取表格框线的前提下,采用图像分块和连通域分析,实现字线分离。实验结果表明,该算法能够滤除大部分文字像... 表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构。提出了一种基于字线分离的预处理算法。该算法在不提取表格框线的前提下,采用图像分块和连通域分析,实现字线分离。实验结果表明,该算法能够滤除大部分文字像素、准确有效突出表格文本图像中的框线信息,达到了预处理目的,是后续表格特征提取和识别的有效预备步骤。 展开更多
关键词 文本图像 表格图像 表格识别 预处理 连通域
下载PDF
一种新的表格单元格矩形识别算法 被引量:3
11
作者 陈优广 顾国庆 +1 位作者 张薇 许彦冰 《计算机工程》 EI CAS CSCD 北大核心 2006年第13期9-11,14,共4页
现有的表格识别算法速度较慢,且仅能容忍表格线的微小断线,文章给出了基于顶点链编码的表格单元格矩形识别算法,利用边界标定自动机,标定表格单元格内环边界并生成顶点链编码,利用顶点链编码特性,有效地去除表格框线上的锯齿,修复断裂... 现有的表格识别算法速度较慢,且仅能容忍表格线的微小断线,文章给出了基于顶点链编码的表格单元格矩形识别算法,利用边界标定自动机,标定表格单元格内环边界并生成顶点链编码,利用顶点链编码特性,有效地去除表格框线上的锯齿,修复断裂的框线,通过搜索单元格矩形4个角的顶点链编码来获得表格单元格的矩形区域。实验证明本算法具有速度快、鲁棒性高、抗表格框线断裂等优点。 展开更多
关键词 顶点链编码 表格识别 边界标定自动机
下载PDF
基于投影特征与结构特征的表格图像识别 被引量:4
12
作者 王绪 平西建 +1 位作者 周林 王会鹏 《计算机工程》 CAS CSCD 北大核心 2011年第1期210-212,共3页
通过分析表格的框线特征与结构特征,提出一种基于投影特征与结构特征的表格文本图像识别算法。该方法通过投影计算提取表格的框线特征,通过击中或击不中变换提取表格的结构特征,根据所提特征重要性的不同,设定分类判决阈值。实验结果表... 通过分析表格的框线特征与结构特征,提出一种基于投影特征与结构特征的表格文本图像识别算法。该方法通过投影计算提取表格的框线特征,通过击中或击不中变换提取表格的结构特征,根据所提特征重要性的不同,设定分类判决阈值。实验结果表明,该方法能准确高效地区分表格文本图像与非表格文本图像,具有很强的实用性。 展开更多
关键词 投影特征 结构特征 表格识别
下载PDF
基于曲式和情感识别的音乐动画CAD系统 被引量:2
13
作者 刘丹 张乃尧 朱汉城 《模式识别与人工智能》 EI CSCD 北大核心 2003年第3期283-287,共5页
本文介绍了一个根据音乐的曲式和情感识别的音乐动画CAD系统。该系统上要由四部分组成。首先对乐曲的曲式特征进行识别从而将整首乐曲分成若干个乐段;然后分别对每一个乐段的情感内涵进行识别;第三,根据动画的物理模型建立基本表演程序... 本文介绍了一个根据音乐的曲式和情感识别的音乐动画CAD系统。该系统上要由四部分组成。首先对乐曲的曲式特征进行识别从而将整首乐曲分成若干个乐段;然后分别对每一个乐段的情感内涵进行识别;第三,根据动画的物理模型建立基本表演程序库;最后,通过对各乐段的情感与基本表演程序库中的基本表演程序进行匹配而生成音乐动画。我们以一个音乐喷泉为动画模型对该方法进行了验证,结果是相当满意的。 展开更多
关键词 计算机图形技术 曲式识别 情感识别 音乐动画 CAD系统
原文传递
精密工程中的“免形状测量模式” 被引量:3
14
作者 石照耀 张斌 李秀明 《纳米技术与精密工程》 EI CAS CSCD 2012年第2期132-136,共5页
为测量未知名义几何模型和参数的零件,提出了"免形状测量模式".该测量模式通过高精度获取被测轮廓的"数据微粒",建立典型几何要素及其内在不变量的理论模型,作为识别被测要素几何形状的准则;根据识别准则识别被测... 为测量未知名义几何模型和参数的零件,提出了"免形状测量模式".该测量模式通过高精度获取被测轮廓的"数据微粒",建立典型几何要素及其内在不变量的理论模型,作为识别被测要素几何形状的准则;根据识别准则识别被测轮廓的名义几何形状;利用数据处理与误差分析软件,确定几何参数进而完成误差评定.论述了两个关键问题,即几何信息获取和几何形状识别.分析了几何信息获取的关键技术,阐述了对测量仪器的要求,介绍了结合内插和外插技术的自适应采样策略;提出了用于几何形状快速识别的6个算子;研制了测量仪器FormFree300,实现了"免形状测量". 展开更多
关键词 精密工程 免形状测量 几何信息获取 形状识别 反求工程
下载PDF
基于深度学习的手写表格识别系统研究与实现 被引量:2
15
作者 李若月 钱强 +1 位作者 张瀚文 方利堃 《软件导刊》 2019年第5期17-20,26,共5页
为了对非固定样式的手写表格文档进行批量识别处理,实现自动录入功能,首先通过空表识别生成单元格信息,分析版面结构;其次对图片进行去噪、倾斜校正、二值化等处理,对手写内容进行分割;最后搭建识别手写字符的卷积神经网络。实验结果表... 为了对非固定样式的手写表格文档进行批量识别处理,实现自动录入功能,首先通过空表识别生成单元格信息,分析版面结构;其次对图片进行去噪、倾斜校正、二值化等处理,对手写内容进行分割;最后搭建识别手写字符的卷积神经网络。实验结果表明,最终实现的识别系统能对不同格式的手写表格进行识别并生成数据格式文件。基于空表识别得到单元格信息的手写表格识别系统能对不同样式的表格进行批量识别处理,且通过CNN搭建识别模型,手写汉字也能被识别,使系统通用性更好,便于应用扩展。 展开更多
关键词 手写汉字识别 表格识别 卷积神经网络 识别系统
下载PDF
基于距离加权的自适应字线分离算法 被引量:2
16
作者 李艳霞 孙羽菲 张玉志 《计算机工程》 CAS CSCD 北大核心 2007年第4期206-208,共3页
提出一种基于距离加权的自适应字线分离算法。应用一定的启发式规则,计算表格线上像素点的权值,将权值与阈值相比较来判断该点是否为字符上的点,其中权值和阈值根据具体表格自动确定。该算法与表格线检测方法无关,且易于实现。实验结果... 提出一种基于距离加权的自适应字线分离算法。应用一定的启发式规则,计算表格线上像素点的权值,将权值与阈值相比较来判断该点是否为字符上的点,其中权值和阈值根据具体表格自动确定。该算法与表格线检测方法无关,且易于实现。实验结果表明,可以很好地处理字线交叠问题,提高了表格识别的正确率。 展开更多
关键词 文档分析和识别 表格识别 字线分离 OCR
下载PDF
通用票据识别系统中的字符切分方法 被引量:2
17
作者 吴畏 丁茂祥 郝红卫 《计算机工程与设计》 CSCD 2004年第1期19-21,共3页
在票据识别系统中,待识别区域字符的切分是整个系统较为关键的一个环节。主要论述了在一个通用票据识别系统中,针对一般类型的票据中常见的几种待识别区域的类型,采用不同方法实现对票据图像中待识别区域的字符进行较为准确、快速的切分... 在票据识别系统中,待识别区域字符的切分是整个系统较为关键的一个环节。主要论述了在一个通用票据识别系统中,针对一般类型的票据中常见的几种待识别区域的类型,采用不同方法实现对票据图像中待识别区域的字符进行较为准确、快速的切分,从而确保整个票据识别系统的识别准确率和识别速度。 展开更多
关键词 票据识别 字符切分 版面分析 字符识别 待识别区域
下载PDF
面向对象的表格图像版面分析方法研究 被引量:1
18
作者 汤英 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第12期82-84,共3页
提出了一种面向对象的表格图像版面分析方法,引入属性关系图的概念来描述表格版面结构,以表达表格组件间的复杂高维关系.属性关系图中属性的引入一方面可以描述组件的非结构特性,另一方面还可以利用属性来表达一些组件间的约束关系.该... 提出了一种面向对象的表格图像版面分析方法,引入属性关系图的概念来描述表格版面结构,以表达表格组件间的复杂高维关系.属性关系图中属性的引入一方面可以描述组件的非结构特性,另一方面还可以利用属性来表达一些组件间的约束关系.该方法已应用于实际系统,测试结果表明该方法能够充分表达表格的结构化特点,同时具有相当的灵活性,为表格分析提供了一个实用的接口. 展开更多
关键词 表格处理 版面分析 表格识别 属性关系图 面向对象
下载PDF
任意倾角表格框线的快速检测 被引量:1
19
作者 周绍光 赵建泉 《计算机工程》 CAS CSCD 北大核心 2008年第3期277-279,共3页
表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投影类方法。而投影方法虽然效率很高,但不能处理严重倾斜的表格。文章给出一种新的检测倾斜表格框线的途... 表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投影类方法。而投影方法虽然效率很高,但不能处理严重倾斜的表格。文章给出一种新的检测倾斜表格框线的途径。算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线,并由此获得所需的角度值,进而沿着角度所指定的方向迅速搜索出边框线。整个检测方法的效率类似于投影法,同时可抗任意角度的旋转。 展开更多
关键词 直线检测 表格框线检测 表格识别 图像分析 表格倾角检测
下载PDF
基于深度卷积神经网络的智能试卷合分系统
20
作者 何苗 荣宪伟 《哈尔滨师范大学自然科学学报》 CAS 2022年第3期59-66,共8页
传统的纸质试卷合分需要依靠人工进行分数的识别与汇总,这种方法难免会出现耗费人力、时间、精力,合分效率很低且易出错误等问题.结合上述实际问题,该文设计并实现了一种基于深度卷积神经网络的智能试卷合分系统,利用摄像头实时获取试... 传统的纸质试卷合分需要依靠人工进行分数的识别与汇总,这种方法难免会出现耗费人力、时间、精力,合分效率很低且易出错误等问题.结合上述实际问题,该文设计并实现了一种基于深度卷积神经网络的智能试卷合分系统,利用摄像头实时获取试卷卷头分数栏信息,实现带有小数点的手写分数的识别与各题分数求和功能,且能够适应不同种类的试卷,具有较强的鲁棒性.该设计基于Mask R-CNN的网络结构进行表格检测定位,并应用了LeNet-5网络对手写数字进行识别,最后将每道题识别出来的分数与通过函数计算得到的总分显示在GUI界面中.实验表明,该系统能够实现对含有小数点的手写试卷分数进行识别与求和,具有较大的实际应用前景. 展开更多
关键词 表格识别 手写数字识别 小数点识别 试卷合分 卷积神经网络
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部