期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
基于分类模板数据库的电气铭牌识别 被引量:3
1
作者 胡洋 石煌雄 +1 位作者 蒋作 潘文林 《现代电子技术》 2021年第2期96-100,共5页
电气铭牌文本行多,识别难度较大,当前技术均难以实现有效准确的识别。为解决这一问题,提出一种基于分类模板数据库的方法辅助电气铭牌识别。根据电气铭牌文本行分布情况,将识别分为不可变区域和可变区域识别。每类铭牌不可变区域相当于... 电气铭牌文本行多,识别难度较大,当前技术均难以实现有效准确的识别。为解决这一问题,提出一种基于分类模板数据库的方法辅助电气铭牌识别。根据电气铭牌文本行分布情况,将识别分为不可变区域和可变区域识别。每类铭牌不可变区域相当于一张图像,所以将文字识别转化为图像分类问题。通过对不可变区域建立分类模板数据库,引进卷积神经网络对电气铭牌图像进行分类。经实验验证,该方法能准确高效地识别电气铭牌的不可变区域,从而大幅提升了电气铭牌识别的准确度。 展开更多
关键词 电气铭牌识别 分类模板数据库 文本 文字识别 辅助识别 图像分类
下载PDF
一种任意方向文本行生成方法
2
作者 王海丰 《计算机时代》 2022年第3期11-13,18,共4页
光学字符识别(OCR)时,输出的文本行顺序需与实际的顺序相符。文章在字符Blob分析的基础上,对两个字符Blob外接矩形的相对位置关系进行划分,确定了各位置关系下同一文本行的判断方法,据此对排序后的字符Blob进行文本行初次生成和文本行... 光学字符识别(OCR)时,输出的文本行顺序需与实际的顺序相符。文章在字符Blob分析的基础上,对两个字符Blob外接矩形的相对位置关系进行划分,确定了各位置关系下同一文本行的判断方法,据此对排序后的字符Blob进行文本行初次生成和文本行二次合并,实现了任意方向文本行的生成。实际测试结果验证了所述方法生成任意方向文本行的有效性。 展开更多
关键词 光学字符识别 BLOB分析 外接矩形 任意方向 文本
下载PDF
文本字切分的研究与实践
3
作者 秦姣华 向旭宇 《益阳师专学报》 2000年第5期54-55,共2页
提出了文本字切分要考虑的问题和字切分的基本思想。
关键词 汉字 文本 字切分 切分算法 印刷体汉字识别
下载PDF
手写笔迹文本行的倾斜矫正技术
4
作者 王逸芳 张德贤 骆威 《计算机与数字工程》 2010年第12期121-123,共3页
在手写笔迹识别中,文本行或多或少地存在一定的倾斜,为了减少倾斜的文本行对后续步骤的影响,文章采用水平投影与离散Wigner-Ville分布结合的方法进行笔迹文档整体和局部倾斜矫正。此方法针对手写笔迹图像中存在的倾斜角不一致问题,能够... 在手写笔迹识别中,文本行或多或少地存在一定的倾斜,为了减少倾斜的文本行对后续步骤的影响,文章采用水平投影与离散Wigner-Ville分布结合的方法进行笔迹文档整体和局部倾斜矫正。此方法针对手写笔迹图像中存在的倾斜角不一致问题,能够准确完成文本行倾斜角的检测和矫正。在HIT-WM数据库上的实验表明,该方法能有效地矫正手写笔迹中的倾斜文本行。 展开更多
关键词 手写 笔迹图像 文本 矫正技术 TEXT WIGNER-VILLE分布 倾斜角 方法 水平投影 倾斜矫正 笔迹识别 数据库 后续步 问题 文章 文档 实验 离散 局部 检测
下载PDF
积厚文档扫描图像校正 被引量:7
5
作者 向世明 赵国英 +2 位作者 陈睿 贾富仓 李华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2005年第1期42-48,共7页
扫描已装订的积厚文档时 ,由于页面不能紧贴于扫描平面 ,会产生两个问题 :(1)扫描图像中离装订线较近的一侧出现黑色的阴影区域 ;(2 )阴影区域中的文本产生扭曲 基于图像信息和几何变形信息 ,提出一种去除阴影和校正文本的算法 首先采... 扫描已装订的积厚文档时 ,由于页面不能紧贴于扫描平面 ,会产生两个问题 :(1)扫描图像中离装订线较近的一侧出现黑色的阴影区域 ;(2 )阴影区域中的文本产生扭曲 基于图像信息和几何变形信息 ,提出一种去除阴影和校正文本的算法 首先采用分块自动阈值算法去除阴影 ;然后通过垂直投影函数、有效包围盒和标记点提取文本行中心线 ,中心线被用于全局几何参数的估计 ;最后 ,扭曲的文本通过估计的几何参数和分片四边形映射进行校正 展开更多
关键词 积厚文档 文本中心线 垂直投影函数 有效包围盒 标记点 几何参数
下载PDF
基于连通域特征的维吾尔手写文本行分割 被引量:6
6
作者 易晓芳 卡米力.木依丁 艾斯卡尔.艾木都拉 《计算机工程与应用》 CSCD 2014年第18期142-146,共5页
针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画... 针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,该方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。 展开更多
关键词 维吾尔文 手写体文本 文本分割 重心 邻域
下载PDF
文档图像识别技术回顾与展望 被引量:6
7
作者 刘成林 《数据与计算发展前沿》 2019年第2期17-25,共9页
【目的】文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标。自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展。本文为科研人员... 【目的】文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标。自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展。本文为科研人员和工程人员提供一个比较全面的文档图像识别技术总体介绍,便于大家开展技术创新和技术应用。【方法】本文在介绍文档识别应用背景的基础上,对该领域历史上主要方法进行回顾,对当前技术状况和研究动态进行分析,并展望未来发展趋势。【结果】1950年代到2000年代,在统计模式识别、特征提取、结构分析、字符切分、字符串识别和版面分析等方面积累了大量有效方法。【结论】近年来深度学习(深度神经网络)逐渐成为主导性的方法,使文字检测和识别的性能得到明显提升,但在复杂版面分析能力、文字识别的可靠性、泛化性等方面仍然存在不足。 展开更多
关键词 文档识别 版面分析 文本检测 深度学习 字符识别 文本识别
下载PDF
基线自适应透视变换的文本行矫正
8
作者 张梦林 杨淑莹 《天津理工大学学报》 2024年第4期76-82,共7页
相机拍摄的文档图像通常存在弯折和透视形变,这将导致由图像提取的文本行弯曲和文字的大小不一致。提出基线自适应透视变换来进行文本行矫正。该方法使用Bezier曲线拟合文本行中心和上、下边界基线,在文本行拉直矫正中加入了横向矫正效... 相机拍摄的文档图像通常存在弯折和透视形变,这将导致由图像提取的文本行弯曲和文字的大小不一致。提出基线自适应透视变换来进行文本行矫正。该方法使用Bezier曲线拟合文本行中心和上、下边界基线,在文本行拉直矫正中加入了横向矫正效果。提出的方法将需要矫正的文本行片段模拟为倾斜平面,当文本行片段高边方向与文档旋转轴向角度为45°时,未经过透视形变与经过透视形变的文本行片段高度比与宽度比的比值相同。根据片段高度与文本行平均高度比值进行宽度变化并计算透视变换矩阵,矫正其中存在的透视形变。对实际拍摄的文档图像提取的文本行进行人工检查,将没有完成的文本行拉直矫正,以及矫正后有字体较大错误形变的文本行图像作为矫正失败的文本行图像,文本行矫正成功的概率约为98.08%。 展开更多
关键词 文档矫正 文本拉直 透视变换 基线估计
下载PDF
基于感知的多方向在线手写笔迹文本行提取 被引量:4
9
作者 敖翔 戴国忠 王宏安 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2007年第1期14-19,共6页
提出一种多方向手写笔迹文本行的提取方法.该方法以视觉感知理论为基础,采取自底向上的策略,先将笔画组合成类比字符的笔画块,然后基于这些笔画块建立链接模型,最后采用分支限界搜索算法从链接模型中找出最优行排列.实验结果表明,该方... 提出一种多方向手写笔迹文本行的提取方法.该方法以视觉感知理论为基础,采取自底向上的策略,先将笔画组合成类比字符的笔画块,然后基于这些笔画块建立链接模型,最后采用分支限界搜索算法从链接模型中找出最优行排列.实验结果表明,该方法能有效地提取多方向笔迹行结构,并适用于弯曲文本行的提取. 展开更多
关键词 在线笔迹 多方向文本 感知结构 链接模型
下载PDF
Attention机制在脱机中文手写体文本行识别中的应用 被引量:5
10
作者 王馨悦 董兰芳 《小型微型计算机系统》 CSCD 北大核心 2019年第9期1876-1880,共5页
脱机中文手写体识别技术可以将人工书写在纸上的汉字转换为电子文档中可编辑的中文格式.由于每个人的书写习惯不同,所以手写体随意性较大、字符之间可能存在粘连,给字符分割增加了难度.为了避免单个字符的分割,本文采用基于Attention的... 脱机中文手写体识别技术可以将人工书写在纸上的汉字转换为电子文档中可编辑的中文格式.由于每个人的书写习惯不同,所以手写体随意性较大、字符之间可能存在粘连,给字符分割增加了难度.为了避免单个字符的分割,本文采用基于Attention的方法实现脱机中文手写体文本行的识别.该方法基于encoder-decoder框架,首先用CNN提取特征,然后通过BLSTM进行编码,最后将BLSTM的输出结果再结合Attention,输入到LSTM进行解码.该方法在针对具有语义信息的CASIA-HWDB2. 0-2. 2数据集上字符准确率达到了95. 76%,比传统的encoder-decoder框架提升了12. 83%. 展开更多
关键词 文本识别 脱机中文手写体 Attention机制 LSTM
下载PDF
基于分段式前景涂抹和背景细化的文本行分割 被引量:4
11
作者 易晓芳 卡米力.木依丁 艾斯卡尔.艾木都拉 《计算机工程》 CAS CSCD 2013年第5期204-208,共5页
现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位... 现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位,利用图像背景的细化获取文本行分割线,给出重心判定算法,从而解决上下文本行之间的文字重叠问题。对210幅图片、2 563个文本行进行实验,结果表明,该算法的出错率仅为3.3%,低于水平投影算法、分段式投影算法和聚类算法,能对文本行进行较为完整的分割。 展开更多
关键词 手写文本 文本分割 分割性能 涂抹 背景细化
下载PDF
基于残差注意网络的端到端手写文本识别方法
12
作者 王寅同 郑豪 +1 位作者 常合友 李朔 《控制与决策》 EI CSCD 北大核心 2023年第7期1825-1834,共10页
中文手写文本识别是模式识别领域中的研究热点问题之一,其存在字符类别数量多、书写风格差异大和训练数据集标记难等问题.针对上述问题,提出无切分无循环的残差注意网络结构用于端到端手写文本识别.首先,以ResNet-26为主体结构,使用深... 中文手写文本识别是模式识别领域中的研究热点问题之一,其存在字符类别数量多、书写风格差异大和训练数据集标记难等问题.针对上述问题,提出无切分无循环的残差注意网络结构用于端到端手写文本识别.首先,以ResNet-26为主体结构,使用深度可分离卷积提取有意义特征,残差注意门控模块提升文本图像中的关键区域的重要性;其次,采用批量双线性插值模型对输入表征进行拉伸-挤压,实现二维文本表征到一维文本行表征的文本行上采样;最后,以连接时序分类作为识别模型的损失函数,实现高层次抽取表征与字符序列标记的对应关系.在CASIA-HWDB2.x和ICDAR2013两个数据集上进行实验研究,结果表明,所提方法在没有任何字符或文本行的位置信息时能够有效地实现端到端手写文本识别,且优于现有的方法. 展开更多
关键词 手写文本识别 深度可分离卷积 残差注意门控 双线性插值 文本上采样 连接时序分类
原文传递
文本行字符基线的精确测定算法 被引量:2
13
作者 卢达 浦炜 谢铭培 《小型微型计算机系统》 EI CSCD 北大核心 2000年第7期726-728,共3页
本文给出了精确测定文本行字符基线的算法 ,讨论了基线检测的容差 .该算法也可用于手写字符的分析 .实验结果表明 ,我们的基线检测算法对不同大小的字符有满意的处理结果 .
关键词 字符识别 文本切分 基线检测 文本处理
下载PDF
脱机手写女书字符图像多方向文本行提取 被引量:4
14
作者 黑光月 王江晴 孙阳光 《计算机应用研究》 CSCD 北大核心 2013年第2期627-630,共4页
针对传统文本行提取方法的不足,提出一种脱机手写女书字符图像多方向文本行提取方法。该方法先将预处理后的女书字符图像通过形态学膨胀和最小外接矩形来提取出女书字符块,然后用Delaunay三角剖分对字符块构建三角网,再根据三个给定的... 针对传统文本行提取方法的不足,提出一种脱机手写女书字符图像多方向文本行提取方法。该方法先将预处理后的女书字符图像通过形态学膨胀和最小外接矩形来提取出女书字符块,然后用Delaunay三角剖分对字符块构建三角网,再根据三个给定的准则计算三角网中每条边的权重构建链接模型,最后根据依权重排序后的边,利用互斥原则搜索出最优文本行。实验结果表明,该方法能有效提取扇面、布帕等不同载体上女书字符图像中的多方向文本行。 展开更多
关键词 女书 多方向文本 脱机手写 最小外接矩形 DELAUNAY三角剖分 链接模型
下载PDF
基于色彩距离最小化和最大色彩差的文本定位 被引量:3
15
作者 刘美华 屈喜龙 +1 位作者 周细凤 梁开健 《光电子.激光》 EI CAS CSCD 北大核心 2015年第10期2008-2015,共8页
提出了一种基于色彩距离最小化和最大色彩差(MCD)的场景文本定位方法。首先,使用多次K均值聚类和色彩距离最小化的方法,从不同复杂程度的场景图像中提取文本连通区域;考虑到色彩聚类方法容易受光照影响,使用基于MCD最大色彩差的方法,提... 提出了一种基于色彩距离最小化和最大色彩差(MCD)的场景文本定位方法。首先,使用多次K均值聚类和色彩距离最小化的方法,从不同复杂程度的场景图像中提取文本连通区域;考虑到色彩聚类方法容易受光照影响,使用基于MCD最大色彩差的方法,提取文本连通区域作为补充,由于将色彩与梯度信息相结合,在一定程度上能克服光照的影响;将得到的连通区域通过设定的字符合并规则,构建文本行;候选文本行中通常包含错误检测的非文本行,为了提高文本检测的正确率,最后采用基于特征提取和机器学习的方法,验证候选文本行,得到文本定位结果。将本文方法在ICDAR2011和ICDAR2013公共数据库上实验,对于ICDAR2011数据集,本文获得的召回率、准确率和F指标分别为0.66、0.77和0.71;对于ICDAR2013数据集,本文获得的召回率、准确率和F指标分别为0.65、0.77和0.70。将本文方法与其它文本检测算法比较,结果表明本文方法的可行性、有效性。 展开更多
关键词 场景文本定位 色彩距离最小化 最大色彩差(MCD) 验证文本
原文传递
基于敏感点颜色聚类和行聚类筛选的文本提取 被引量:3
16
作者 刘琼 周慧灿 王耀南 《计算机应用》 CSCD 北大核心 2010年第2期449-452,共4页
针对现有的文本提取算法不能适应复杂背景变化和文字本身的形状变化问题,提出一种基于敏感点颜色两级聚类和文本行聚类筛选的方法。新方法利用人眼视觉对颜色大幅度变化更敏感的特点,以敏感点的主要颜色作为聚类分析的依据,克服了现有... 针对现有的文本提取算法不能适应复杂背景变化和文字本身的形状变化问题,提出一种基于敏感点颜色两级聚类和文本行聚类筛选的方法。新方法利用人眼视觉对颜色大幅度变化更敏感的特点,以敏感点的主要颜色作为聚类分析的依据,克服了现有阈值方法和聚类方法受背景颜色变化影响较大的问题。在此基础上,以文本行的空间排列特征为依据进进行文本行筛选,以克服一般方法容易受文字形状和尺寸变化影响的缺点。实验表明,新方法对于背景的复杂变化和文字的形状尺寸变化都具有很好的适应性。 展开更多
关键词 文本提取 K均值聚类 边缘密度 文本聚类
下载PDF
基于图聚类的脱机手写文档图像文本行分割 被引量:3
17
作者 黄亮 殷飞 陈庆虎 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第3期33-36,共4页
提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶... 提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶点以及顶点对之间的边构成文档图,边上的权值由两个单一文本行分割算法的结果决定.于是,文本行分割的任务就转化为如何以最小代价对文档图进行划分的问题.该融合算法在哈尔滨工业大学多人手写数据库上取得了较好的效果,召回率为99.31%,错误率为0.94%. 展开更多
关键词 文本分割 自适应游程平滑 最小生成树 距离测度学习 图聚类的集成
原文传递
结合文字核心区域和扩展生长的藏文古籍文本行切分 被引量:3
18
作者 李金成 王筱娟 +2 位作者 王维兰 林强 胡鹏飞 《激光与光电子学进展》 CSCD 北大核心 2021年第2期105-115,共11页
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆... 藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。 展开更多
关键词 图像处理 藏文古籍文档图像 文本切分 文字核心区域 扩展生长
原文传递
APSENet:一种基于实例分割网络的满文档案文本行检测方法 被引量:2
19
作者 赫欣 李厚杰 +2 位作者 周瑜 郑蕊蕊 贺建军 《中央民族大学学报(自然科学版)》 2022年第1期19-27,共9页
文本行检测是满文档案数字化的重要环节,目前相关研究较少,特别是在长文本检测方面。本文借鉴PSENet图像实例分割模型,提出了APSENet的满文档案文本行检测方法。该方法使用Res Net网络提取满文档案文本行特征,通过引入渐进式尺度扩展算... 文本行检测是满文档案数字化的重要环节,目前相关研究较少,特别是在长文本检测方面。本文借鉴PSENet图像实例分割模型,提出了APSENet的满文档案文本行检测方法。该方法使用Res Net网络提取满文档案文本行特征,通过引入渐进式尺度扩展算法用于后处理网络输出的分割mask,可以有效解决长文本难以检测的问题,通过引入特征通道注意力机制,可以解决由无关背景干扰引起的文本框边距较大问题。实验结果表明,该算法可以取得较好的检测效果。 展开更多
关键词 满文档案 文本检测 注意力机制 渐进式尺度扩展
下载PDF
应用MSER和局部二值化的网络图片文本定位 被引量:2
20
作者 刘美华 傅彩明 +1 位作者 梁开健 周细凤 《光电子.激光》 EI CAS CSCD 北大核心 2018年第6期660-668,共9页
网络图片中的文本向用户提供了重要的语义信息,定位与识别网络图片中的文本能辅助网页内容的管理与搜索。本文提出了一种基于最大稳定极值区域(Maximally Stable Extremal Regions,MSER)和局部二值化的网络图片文本定位方法。首先,使用M... 网络图片中的文本向用户提供了重要的语义信息,定位与识别网络图片中的文本能辅助网页内容的管理与搜索。本文提出了一种基于最大稳定极值区域(Maximally Stable Extremal Regions,MSER)和局部二值化的网络图片文本定位方法。首先,使用MSER方法提取网络图片多个图像通道中的连通域,并采用局部二值化方法精简连通域,保证较高的文字检测率,同时减少连通域的数量。然后,通过提取连通域的底层特征,校验连通域。最后,使用连通域构造文本行,分析文本行与相关连通域的特征,查找丢失的文字,得到完整的文本行,并通过后处理得到文本定位结果。本文方法能获得与传统MSER方法相当的文字检测率为92.76%,而平均每幅图像产生连通域的数量大幅减少为232。在文本定位标准数据集ICDAR2013数据集上,采用最新文本定位评价准则,本文获得文本召回率、准确率和F综合指标分别为82.28%、89.35%和85.67%;采用传统文本定位评价准则,本文获得文本召回率、准确率和F综合指标分别为87.05%、89.42%和88.22%。实验结果表明了基于MSER和局部二值化的文本定位方法的有效性。 展开更多
关键词 网络图片文本定位 最大稳定极值区域 局部二值化 校验连通域 构造文本
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部