-
题名基于凸包像素比特征的粘连汉字切分
被引量:3
- 1
-
-
作者
魏湘辉
马少平
-
机构
中国科学院软件研究所
智能技术与系统国家重点实验室清华大学计算机科学与技术系
-
出处
《中文信息学报》
CSCD
北大核心
2005年第1期91-97,共7页
-
基金
自然科学基金资助项目 (6 0 2 2 30 0 4 )
国家 86 3高科技资助项目 (2 0 0 1AA114 0 82 )
-
文摘
汉字切分正确与否直接影响了汉字识别系统的识别率 ,粘连汉字则是切分中的难点。本文将基于背景细化的切分方法应用于《四库全书》的两字符粘连汉字数据集 ,并针对其中切分路径选择问题 ,提出了一种新特征 -凸包像素比 ,反映了在不同切分路径下汉字结构变化的特性。实验结果表明该特征对多种分类器均能有效地提高切分路径选择的正确率。其中在使用基于高斯混合模型分类器时取得了 88 6 %正确率。
-
关键词
人工智能
模式识别
粘连汉字
汉字切分
背景细化
凸包
-
Keywords
artificial intelligence
pattern recognition
touching chinese character
segmentation of chinese character
background-thinning
convex hull
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名粘连字符切分综述
被引量:2
- 2
-
-
作者
魏湘辉
马少平
-
机构
中国科学院软件所
清华大学计算机科学与技术系
-
出处
《计算机科学》
CSCD
北大核心
2004年第11期199-201,共3页
-
基金
自然科学基金(No.60223004)
国家863高科技项目(No.2001AA114082)
-
文摘
字符切分是字符识别系统的一个重要环节。粘连则是指字符图像间有笔画接触的情况,它普遍存在于手写和低质量的印刷文档中。然而普通切分算法很难处理粘连字符。本文综述了主要的粘连字符切分算法以及切分路径的评价方法,在详细介绍算法流程的基础上,对每种算法的优缺点以及粘连字符切分的未来工作进行了探讨。
-
关键词
连字符
切分算法
字符切分
文档
字符识别
算法流程
笔画
粘连
综述
处理
-
Keywords
character segmentation,touching character segmentation,character recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP317.3
[自动化与计算机技术—计算机科学与技术]
-
-
题名雷管编码图像中的黏连字符分割
被引量:2
- 3
-
-
作者
徐望明
陈光
伍世虔
尹亮
-
机构
武汉科技大学信息科学与工程学院
武汉科技大学教育部冶金自动化与检测技术工程研究中心
武汉科技大学机器人与智能系统研究院
-
出处
《实验室研究与探索》
CAS
北大核心
2019年第10期9-13,共5页
-
基金
国家自然科学基金项目(61775172,51805386)
武汉科技大学教学研究项目实验专项(2014Z034)
-
文摘
以雷管编码识别项目为工程实践案例,提出一种基于最优分割路径的黏连字符分割算法,克服黏连字符对雷管编码识别性能的影响。对输入图像增强并二值化后通过连通域分析提取黏连字符区域,利用垂直投影获得黏连字符的垂直投影直方图,而且同时获得上边界和下边界位置图,分别从中检测局部谷底点并验证其"穿越特性"和"距离特性"得到黏连字符的候选分割点,再按可信度从中选取有效分割点,分别以黏连字符左、右两端为起点向另一端进行字符切分形成两条分割路径,选取方差较小的分割路径作为最优分割路径对黏连字符切分。实验研究表明,该算法能有效克服工业场景中由磨损、划痕、锈迹等造成的金属雷管图像中编码字符黏连问题,比传统算法取得了更好的分割效果和更高的分割准确率。
-
关键词
黏连字符
垂直投影
最优分割路径
字符分割
-
Keywords
touching characters
vertical projection
optimal segmentation path
character segmentation
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名印刷哈萨克斯拉夫粘连字符的切分方法
- 4
-
-
作者
刘喜军
哈力木拉提.买买提
-
机构
新疆大学多语种信息技术实验中心
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第12期4370-4374,共5页
-
基金
国家自然科学基金项目(60863009
61032008
61163031)
-
文摘
哈萨克斯拉夫图像文本经过行切分和列切分后,存在水平方向接触和垂直方向重叠的粘连字符。为提高字符识别率,依据字符连通域的最小外接矩形切分开垂直方向重叠的粘连字符图像块;利用判决条件:字符宽度概率密度分布图、字符图像块垂直投影的波峰数目和字符图像块垂直投影波峰的对称性,分离初始粘连字符图像块中正确的单个字符图像块和实际接触的粘连字符图像块;在允许的字符宽度范围内,寻找粘连字符图像垂直投影图的极小值点,以切分实际接触的粘连字符。实验结果表明,该方法泛化能力较好且识别率有明显提高。
-
关键词
粘连字符切分
垂直投影
波峰
极小值
概率密度分布图
-
Keywords
touching character segmentation
vertical projection
wave
minimum value
probability density
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-