期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于可变窗口的古代手写汉字多步切分方法 被引量:6
1
作者 吴相锦 张忠林 周生龙 《计算机工程与设计》 北大核心 2016年第4期1102-1106,共5页
根据古文献和古代手写体汉字纵向书写,上下字多粘连、多重叠等特点,提出一种基于可变窗口的古代手写汉字多步切分方法。对古文献进行列切分,列切分采用投影过滤的方法,采用投影法对手写字进行粗切分,对存在粘连或重叠的字串采用可变窗... 根据古文献和古代手写体汉字纵向书写,上下字多粘连、多重叠等特点,提出一种基于可变窗口的古代手写汉字多步切分方法。对古文献进行列切分,列切分采用投影过滤的方法,采用投影法对手写字进行粗切分,对存在粘连或重叠的字串采用可变窗口的方法进行细切分,确定字串中每一个单字的切分路径。实验结果表明,该方法能够有效应用于古文献中手写汉字的切分。 展开更多
关键词 古文献 手写汉字 列切分 汉字切分 可变窗口 切分路径
下载PDF
基于连通域特征的维吾尔手写文本行分割 被引量:6
2
作者 易晓芳 卡米力.木依丁 艾斯卡尔.艾木都拉 《计算机工程与应用》 CSCD 2014年第18期142-146,共5页
针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画... 针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,该方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。 展开更多
关键词 维吾尔文 手写体文本 文本行分割 重心 邻域
下载PDF
基于分段式前景涂抹和背景细化的文本行分割 被引量:4
3
作者 易晓芳 卡米力.木依丁 艾斯卡尔.艾木都拉 《计算机工程》 CAS CSCD 2013年第5期204-208,共5页
现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位... 现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位,利用图像背景的细化获取文本行分割线,给出重心判定算法,从而解决上下文本行之间的文字重叠问题。对210幅图片、2 563个文本行进行实验,结果表明,该算法的出错率仅为3.3%,低于水平投影算法、分段式投影算法和聚类算法,能对文本行进行较为完整的分割。 展开更多
关键词 手写文本 文本行分割 分割性能 涂抹 背景细化
下载PDF
基于复杂背景的彩色图像中维吾尔文字切分 被引量:4
4
作者 玛日耶姆古丽.米吉提 哈力旦. A 《计算机工程与科学》 CSCD 北大核心 2012年第9期98-103,共6页
沿着基线并具有大量附加部分书写是维吾尔文一大特点,这些特点使复杂背景的彩色图像中维吾尔文字行与字的切分和识别成为一个既困难又有趣的问题。本文首先对复杂彩色图像进行灰度化,其次将彩色图像转换为灰度化的边缘图像,再对图像进... 沿着基线并具有大量附加部分书写是维吾尔文一大特点,这些特点使复杂背景的彩色图像中维吾尔文字行与字的切分和识别成为一个既困难又有趣的问题。本文首先对复杂彩色图像进行灰度化,其次将彩色图像转换为灰度化的边缘图像,再对图像进行局域二值化,然后进行区域检测和边缘调整,初步实现了图像中维吾尔文字行的定位,紧接着根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段。实验结果表明,文字行的切分准确率达到96%,字切分准确率达到98%以上。 展开更多
关键词 复杂彩色图像 区域检测 文字行切分 字切分
下载PDF
文本行字符基线的精确测定算法 被引量:2
5
作者 卢达 浦炜 谢铭培 《小型微型计算机系统》 EI CSCD 北大核心 2000年第7期726-728,共3页
本文给出了精确测定文本行字符基线的算法 ,讨论了基线检测的容差 .该算法也可用于手写字符的分析 .实验结果表明 ,我们的基线检测算法对不同大小的字符有满意的处理结果 .
关键词 字符识别 文本行切分 基线检测 文本处理
下载PDF
基于缝隙裁剪的满文单词分割和提取方法研究 被引量:4
6
作者 张晶 许爽 +2 位作者 贺建军 李敏 郑蕊蕊 《中文信息学报》 CSCD 北大核心 2019年第2期81-88,共8页
从大篇幅的满文文档图像中分割和提取满文单词,是满文文档分析的关键步骤。该文提出了一种基于缝隙剪裁的满文文档图像单词分割和提取方法。首先,通过投影轮廓匹配策略初步涂抹并确定文本列数目;然后,在相邻文本列间自底向上地进行动态... 从大篇幅的满文文档图像中分割和提取满文单词,是满文文档分析的关键步骤。该文提出了一种基于缝隙剪裁的满文文档图像单词分割和提取方法。首先,通过投影轮廓匹配策略初步涂抹并确定文本列数目;然后,在相邻文本列间自底向上地进行动态规划,寻找最小能量线,并通过中线区域约束得到不损坏满文文字部件的最佳分割线;最后,依据分割线提取独立满文文本列进而提取满文单词。结果表明,该方法在满文文档图像数据库上取得了较好的分割和提取效果。 展开更多
关键词 满文文档图像 缝隙裁剪 文本列分割 投影轮廓匹配 区域约束
下载PDF
基于着色处理的维吾尔文手写文本行分割 被引量:4
7
作者 艾斯卡尔.艾木都拉 易晓芳 卡米力.木依丁 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第2期259-264,共6页
针对维吾尔文手写体文本中行分割问题,该文根据维吾尔文字包含区分字母的诸多点笔画和附加部分的特点,对文字主体笔画部分采用分段式前景涂抹算法,并将涂抹后图像的前景部分进行细化运算,通过细化线条与原图像的叠加、着色处理获取主体... 针对维吾尔文手写体文本中行分割问题,该文根据维吾尔文字包含区分字母的诸多点笔画和附加部分的特点,对文字主体笔画部分采用分段式前景涂抹算法,并将涂抹后图像的前景部分进行细化运算,通过细化线条与原图像的叠加、着色处理获取主体文本区域定位;然后通过重心辐射扫描的方法,解决了剩余细小笔画的文本行归附问题。实验结果表明:该文方法与常见的水平投影、分段式投影与基于涂抹方法相比具有更好的行分割效果。 展开更多
关键词 维吾尔文 手写体文本 行分割 细化 着色处理
原文传递
结合文字核心区域和扩展生长的藏文古籍文本行切分 被引量:3
8
作者 李金成 王筱娟 +2 位作者 王维兰 林强 胡鹏飞 《激光与光电子学进展》 CSCD 北大核心 2021年第2期105-115,共11页
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆... 藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。 展开更多
关键词 图像处理 藏文古籍文档图像 文本行切分 文字核心区域 扩展生长
原文传递
基于图聚类的脱机手写文档图像文本行分割 被引量:3
9
作者 黄亮 殷飞 陈庆虎 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第3期33-36,共4页
提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶... 提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶点以及顶点对之间的边构成文档图,边上的权值由两个单一文本行分割算法的结果决定.于是,文本行分割的任务就转化为如何以最小代价对文档图进行划分的问题.该融合算法在哈尔滨工业大学多人手写数据库上取得了较好的效果,召回率为99.31%,错误率为0.94%. 展开更多
关键词 文本行分割 自适应游程平滑 最小生成树 距离测度学习 图聚类的集成
原文传递
高性能的多体印刷英文识别系统的实现 被引量:2
10
作者 陈国平 张明新 +1 位作者 付跃文 王劲林 《计算机工程与应用》 CSCD 北大核心 2006年第12期183-186,共4页
提高低质量文本图像的识别率是现今文字识别研究的重要方向。文章对倾斜文本行的切分算法,断裂、粘连、交叠字符的切分算法以及后处理作了较为深入的研究,提出一些新的算法。该系统能够识别多达260种字体,包括黑体、斜体等字体,对训练... 提高低质量文本图像的识别率是现今文字识别研究的重要方向。文章对倾斜文本行的切分算法,断裂、粘连、交叠字符的切分算法以及后处理作了较为深入的研究,提出一些新的算法。该系统能够识别多达260种字体,包括黑体、斜体等字体,对训练集的识别率达到98.5%,并在实际应用中取得了良好效果。 展开更多
关键词 光学字符识别 行切分 字符切分 后处理
下载PDF
基于多重规则和路径评价的在线中英文手写识别方法 被引量:1
11
作者 付鹏斌 刘鹏辉 +1 位作者 杨惠荣 董澳静 《计算机工程》 CAS CSCD 北大核心 2022年第3期253-262,共10页
手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重... 手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重叠率规则的整合以及连笔切分,得到一系列字符片段,同时利用笔画个数、宽高比、中心偏离、平滑度等几何特征和识别置信度,对字符片段进行中英文分类。在此基础上,根据分类结果并结合自然语言模型的路径评价及动态规划搜索算法,分别对候选的中、英文字符片段进行合并处理,得到待识别的中、英文字符序列,并将其分别送入卷积神经网络的中、英文识别模型中,得到手写文本识别结果。实验结果表明,在线手写中英文混合文本识别正确率达93.67%,不仅能切分在线手写中文文本行,而且对包含字符连笔的在线手写中英文文本行也有较好的切分效果。 展开更多
关键词 在线手写识别 中英文混合手写 中英文分类 文本行切分 路径评价
下载PDF
东巴象形文字文档图像的文本行自动分割算法研究
12
作者 康厚良 杨玉婷 《图学学报》 CSCD 北大核心 2022年第5期865-874,共10页
以卷积神经网络(CNN)为代表的深度学习技术在图像分类和识别领域表现出了非常优异的性能。但东巴象形文字未有标准、公开的数据集,无法借鉴或使用已有的深度学习算法。为了快速建立权威、有效的东巴文字库,分析已出版东巴文档的版面结构... 以卷积神经网络(CNN)为代表的深度学习技术在图像分类和识别领域表现出了非常优异的性能。但东巴象形文字未有标准、公开的数据集,无法借鉴或使用已有的深度学习算法。为了快速建立权威、有效的东巴文字库,分析已出版东巴文档的版面结构,从文档中提取文本行、东巴字成为了当前的首要任务。因此,结合东巴象形文字文档图像的结构特点,给出了东巴文档图像的文本行自动分割算法。首先利用基于密度和距离的k-均值聚类算法确定了文本行的分类数量和分类标准;然后,通过文字块的二次处理矫正了分割中的错误结果,提高了算法的准确率。在充分利用东巴字文档结构特征的同时,保留了机器学习模型客观、无主观经验影响的优势。通过实验表明,该算法可用于东巴文档图像、脱机手写汉字、东巴经的文本行分割,以及文本行中东巴字和汉字的分割,具有实现简单、准确性高、适应性强的特点,从而为东巴文字库的建立奠定基础。 展开更多
关键词 东巴象形文字 东巴文档分析 文本行分割 投影分割 d-K-means
下载PDF
中英文混排扭曲文本图像快速校正方法 被引量:1
13
作者 王景中 孙婷 童立靖 《图学学报》 CSCD 北大核心 2015年第6期920-925,共6页
针对OCR在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行,得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获... 针对OCR在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行,得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒;然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果,校正后图像OCR识别率有明显提高。 展开更多
关键词 中英文混排 扭曲文档图像 文本行提取 字符切分
下载PDF
文本字切分的研究与实践
14
作者 秦姣华 向旭宇 《益阳师专学报》 2000年第5期54-55,共2页
提出了文本字切分要考虑的问题和字切分的基本思想。
关键词 汉字 文本行 字切分 切分算法 印刷体汉字识别
下载PDF
脱机手写维吾尔文本行字符粘连区定位及分割 被引量:1
15
作者 张鑫 艾斯卡尔.艾木都拉 卡米力.木依丁 《激光杂志》 CAS CSCD 北大核心 2014年第11期4-10,共7页
在大篇幅的手写维吾尔文文本图像中,往往会出现粘连字符这一现象。这一现象会对文本行分析和笔迹鉴别等研究工作造成影响,同时所处环境为大篇幅手写图像,在对粘连字符切分时会受到其余非粘连字符的较大干扰。针对上述问题,本文提出了对... 在大篇幅的手写维吾尔文文本图像中,往往会出现粘连字符这一现象。这一现象会对文本行分析和笔迹鉴别等研究工作造成影响,同时所处环境为大篇幅手写图像,在对粘连字符切分时会受到其余非粘连字符的较大干扰。针对上述问题,本文提出了对手写文本图像定位线的正确提取方案,以连通域特性为基础,通过定位线与文本图像融合,使行间粘连字符所在文本行为同一连通域想法,可自动提取出粘连文本行,再根据粘连字符所占宽度和高度大于非粘连字符,从而自动提取出粘连字符。对提取出的粘连字符通过定位线可确定出粘连区域,对粘连点所处位置进行统计分析后在该位置处添加一条与背景同色细线从而达到分割效果,最后对分割后的粘连文本行通过着色方法逐行提取。实验表明,上述问题通过我们的方法得到了很好的解决。在实验结果分析中,本文给出了每个算法的性能指标数据,并与其它文献进行了对比分析,论证了本文研究方法的可行性及存在的一些主要问题。 展开更多
关键词 大篇幅文本图像 定位线提取 粘连文本行 粘连字符 字符分割
下载PDF
基于高阶相关聚类的脱机手写文本行分割 被引量:1
16
作者 殷亚林 刘爱民 周祥东 《华中师范大学学报(自然科学版)》 CAS 北大核心 2017年第1期18-22,34,共6页
从手写文档图像中提取出文本行是文档分析的一个重要预处理步骤,但是由于手写文本行之间通常行方向不平行,甚至存在着交叠和弯曲,所以它仍然是一个具有挑战性的问题.针对该问题,提出了一种基于高阶相关聚类的脱机中文手写文本行的分割算... 从手写文档图像中提取出文本行是文档分析的一个重要预处理步骤,但是由于手写文本行之间通常行方向不平行,甚至存在着交叠和弯曲,所以它仍然是一个具有挑战性的问题.针对该问题,提出了一种基于高阶相关聚类的脱机中文手写文本行的分割算法.首先,使用连通部件构成一个文档超图,然后,在学习所得的相似性度量准则的约束下,通过高阶相关聚类算法将连通部件对标记为属于或者不属于同一文本行;最后,使用union-find算法将连通部件连接成为不同的文本行.该算法在HIT-MW脱机手写数据库上的803幅文档上取得了较好的效果,召回率99.05%,错误率为1.96%. 展开更多
关键词 手写文本行分割 高阶相关聚类 超图
下载PDF
回归——聚类联合框架下的手写文本行提取
17
作者 朱健菲 应自炉 陈鹏飞 《中国图象图形学报》 CSCD 北大核心 2018年第8期1207-1217,共11页
目的手写文本行提取是文档图像处理中的重要基础步骤,对于无约束手写文本图像,文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。利用传统的几何分割或聚类的方法往往无法保证文本行边缘的精确分割。针对这些问题提出一种基于文本... 目的手写文本行提取是文档图像处理中的重要基础步骤,对于无约束手写文本图像,文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。利用传统的几何分割或聚类的方法往往无法保证文本行边缘的精确分割。针对这些问题提出一种基于文本行回归-聚类联合框架的手写文本行提取方法。方法首先,采用各向异性高斯滤波器组对图像进行多尺度、多方向分析,利用拖尾效应检测脊形结构提取文本行主体区域,并对其骨架化得到文本行回归模型。然后,以连通域为基本图像单元建立超像素表示,为实现超像素的聚类,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现超像素的聚类与所属文本行标注。在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割。结果在HIT-MW脱机手写中文文档数据集上进行文本行提取测试,检测率DR为99.83%,识别准确率RA为99.92%。结论实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度。在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性。 展开更多
关键词 手写文本行提取 超像素 图像分割 回归 聚类
原文传递
基于简化Mumford-Shah模型的文本行和段落分割算法
18
作者 赵娜 王希常 刘江 《信息技术与信息化》 2009年第5期66-69,共4页
文本行和段落分割是文档图像处理过程中的重要步骤。本文提出了一种基于简化Mumford-Shah模型的新的文本行和段落分割算法,该算法是脚本语言独立的。为了提高文本行和段落分割算法的有效性,首先使用高斯滤波器对文档图像进行平滑,然后... 文本行和段落分割是文档图像处理过程中的重要步骤。本文提出了一种基于简化Mumford-Shah模型的新的文本行和段落分割算法,该算法是脚本语言独立的。为了提高文本行和段落分割算法的有效性,首先使用高斯滤波器对文档图像进行平滑,然后再在此基础上运用简化的Mumford-Shah模型的水平集图像分割算法分割文档图像。最后,利用数学形态学方法处理文档中粘连和交叠情况。实验表明,该算法可以准确快速的分割目标物体,而且算法与初始轮廓线位置无关、不受边界轮廓线连续性限制、对图像噪声具有很强的鲁棒性。 展开更多
关键词 文本行和段落分割 简化Mumford—Shah模型 水平集 形态学
下载PDF
基于线条识别的扫描工程图字线分割方法 被引量:2
19
作者 宋继强 苏丰 蔡士杰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第5期535-541,共7页
在扫描工程图矢量化中 ,文字位图与图形位图分割的问题一直被广泛关注 .许多现有方法根据连通区的形态特征和空间分布来分割文字和图形的位图 ,然后分别识别 ,其处理能力都局限在无粘连情况下 ,无法处理字线粘连及相交的情况 ,且难以区... 在扫描工程图矢量化中 ,文字位图与图形位图分割的问题一直被广泛关注 .许多现有方法根据连通区的形态特征和空间分布来分割文字和图形的位图 ,然后分别识别 ,其处理能力都局限在无粘连情况下 ,无法处理字线粘连及相交的情况 ,且难以区分尺寸范围相近或形态相似的文字与图形 .提出一种基于线条识别的文字 /图形分割方法 ,通过准确地识别线条并抽取其位图来分离文字 ,不仅保证了分割的正确性 。 展开更多
关键词 字线分割 矢量化 字符串组织 线条识别 图纸识别 扫描程图 位图
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部