-
题名基于多信息融合的中文手写地址字符串切分与识别
被引量:7
- 1
-
-
作者
付强
丁晓青
蒋焰
-
机构
智能技术与系统国家重点实验室清华大学电子工程系
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2008年第12期2916-2920,共5页
-
基金
国家自然科学基金(60472002)
西门子公司合作项目(20030829-24022SI202)资助课题
-
文摘
该文提出了一种有效的中文手写地址字符串的切分与识别方法。首先,利用笔划提取与笔划合并将字符串图像进行过切分,得到"字根"图像序列;然后综合利用几何信息、识别信息和语义信息挑选最优的"字根"合并路径,得到最优的切分结果及对应的最优识别结果。其中,几何信息是根据当前字符串自身的特点统计得到,因此可适应不同书写风格的字符串。识别信息由单字分类器给出,包括10个候选识别结果及其相应的置信度;单字分类器采用MQDF分类器。语义信息用基于字的bi-gram模型进行描述,模型参数是从包含18万条地址数据的数据库中统计得到的。用3000个实际的手写地址样本做试验,单字识别正确率达到88.28%。
-
关键词
地址识别
字符串切分
手写字符串识别
-
Keywords
Address recognition
character string segmentation
Handwritten character string recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于组件合并的手写体汉字串分割
被引量:7
- 2
-
-
作者
吕岳
施鹏飞
张克华
-
机构
上海交通大学图像处理与模式识别研究所
-
出处
《软件学报》
EI
CSCD
北大核心
2000年第11期1554-1559,共6页
-
基金
国家自然科学基金资助项目(60075007)
-
文摘
人们对孤立的手写体汉字字符的离线识别做了大量的研究工作 ,而走向实用化的进展并不快 .除了单字识别率不理想以外 ,从文本中正确分割出单个汉字字符也是一个主要难题 ,因为字符的识别离不开正确分割 .利用汉字的基本结构特征 ,根据两个组件之间的上下、左右和包围关系 ,对组件进行合并形成完整的汉字图像 .对整个汉字字符串中组件的宽度和相邻组件的间距进行分析 ,有助于左右关系组件的合并 .实验结果表明 ,该方法对手写体汉字字符串具有理想的分割效果 .
-
关键词
手写体汉字串
结构特征
字符分割
组件
合并
-
Keywords
handwritten Chinese character string
structural feature
character segmentation
element
merging
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-