基于不对称性的相似汉字识别方法

Asymmetry-based Recognition Method for Similar Chinese Characters

下载PDF

导出

摘要相似字识别的正确与否对整个识别系统的准确性和可用性都有着极大的影响。在实际应用中 ,我们发现相似汉字之间的误识存在不对称性 ,并对这种不对称现象的成因进行了细致的探讨和分析。基于这种不对称性 ,本文提出了一种分类的部分空间方法来解决相似字的识别问题。相似字按其结构特点被分成若干基本类别 ,不同类别在相应的部分空间提取不同的特征进行比较 ,以达到正确识别相似字的目的。实验结果表明了本方法的有效性 ,相似字识别的准确性得到了很大的提高 ,其中易错相似字的识别正确率平均提高了4 5 5个百分点 ,不易错相似字的识别正确率平均提高了 0 38个百分点。 Similar characters recognition has a great impact on the accuracy and usability of the whole OCR system. In this paper, the asymmetry in similar Chinese character recognition is introduced. The causes of the asymmetry phenomena are discussed and analyzed in details. Based on the asymmetry, we propose a method of category-based partial area matching for similar Chinese characters recognition. According to their structural characteristics, similar characters are divided into some different elementary categories. The different category features extracted in corresponding partial area are used to recognize similar characters. Our experiment results show the validity of the proposed method, which significantly improves the accuracy of similar Chinese character recognition. There are a 4.55 percent improvement on error-prone similar Chinese character recognition and a 0.38 percent improvement on less error-prone one.

作者孙羽菲陈艳张玉志

机构地区中国科学院计算技术研究所

出处《中文信息学报》 CSCD 北大核心 2004年第2期51-57,共7页 Journal of Chinese Information Processing

基金中科院计算所领域前沿青年基金资助项目 (2 0 0 2 6 180 - 19)

关键词人工智能模式识别不对称性相似汉字识别部分空间法分类 artificial intelligence pattern recognition asymmetry similar Chinese character recognition partial area matching category

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1田盛丰,黄厚宽,李洪波.基于支持向量机的手写体相似字识别[J].中文信息学报,2000,14(3):37-41. 被引量：28
2梁曼君,石竹.基于神经网络的相似汉字识别的研究[J].中文信息学报,1993,7(3):26-32. 被引量：1
3张德喜,马少平,朱绍文,金奕江.基于统计与神经元方法相结合的手写体相似字识别[J].中文信息学报,1999,13(3):33-39. 被引量：12
4蔺志青,郭军.一种相似汉字的识别算法[J].中文信息学报,2002,16(5):44-48. 被引量：14

二级参考文献18

1洪沁,何振亚.手写体数字的神经网络识别方法[J].模式识别与人工智能,1994,7(1):66-71. 被引量：9
2谢光毅,钟义信.神经网络用于手写体数字识别[J].模式识别与人工智能,1994,7(4):334-337. 被引量：8
3郭军,马跃,盛立东,钟义信.发展中的文字识别理论与技术[J].电子学报,1995,23(10):184-187. 被引量：21
4王国胤,施鸿宝.汉字识别的并行神经网络方法[J].模式识别与人工智能,1996,9(1):96-101. 被引量：5
5马少平.脱机手写汉字识别研究[博士学位论文].北京:清华大学,1995.. 被引量：1
6马少平夏莹等.基于非线性规格化的手写体汉字识别[J].软件学报,1996,(836):200-205. 被引量：1
7焦李成被引量：1
8马少平,夏莹,朱小燕.基于模糊方向线素特征的手写体汉字识别[J].清华大学学报（自然科学版）,1997,37(3):42-45. 被引量：37
9马少平，软件学报，1996年，863专刊，200页被引量：1
10马少平，博士学位论文，1995年被引量：1

共引文献44

1Lai Wuxing Zhang Guicai Shi Tielin Yang ShuziSchool of Mechanical Science and Engineering, Huazhong University of Science and Technology,Wuhan 430074, China.CLASSIFICATION OF GEAR FAULTS USING HIGHER-ORDER STATISTICS AND SUPPORT VECTOR MACHINES[J].Chinese Journal of Mechanical Engineering,2002,15(3):243-247. 被引量：6
2封筠,王彦芳,杨扬,王小平,刘永军.SVM多值分类器在脱机手写体相似汉字识别中的应用[J].计算机工程与应用,2004,40(27):200-202. 被引量：8
3李盼池,许少华.支持向量机在模式识别中的核函数特性分析[J].计算机工程与设计,2005,26(2):302-304. 被引量：98
4辛宪会,郭建星,解志刚,邱振戈.一种基于支持向量机的纹理图像分类法[J].海洋测绘,2005,25(2):41-43. 被引量：8
5孙权森,金忠,王平安,夏德深.一种有效的手写体汉字组合特征的抽取与识别算法[J].中文信息学报,2005,19(4):78-83. 被引量：2
6封筠,杨扬,朴春慧.一种手写相似汉字特征选择方法的研究[J].计算机工程,2005,31(15):33-34.
7任俊玲,郭军.HCL2000手写汉字数据库的更新及相关研究[J].中文信息学报,2005,19(5):97-104. 被引量：4
8田相军,罗琳.综合图像灰度熵和灰度值的人脸识别方法[J].现代电子技术,2005,28(24):46-48. 被引量：3
9张宏烈.支持向量机在字符识别中的应用研究[J].微计算机信息,2006(04Z):245-247. 被引量：11
10孔凡国,黄伟.基于支持向量机的连杆曲线识别[J].机械设计与研究,2006,22(2):26-28. 被引量：2

1蔺志青,郭军.一种相似汉字的识别算法[J].中文信息学报,2002,16(5):44-48. 被引量：14
2杨钊,陶大鹏,张树业,金连文.大数据下的基于深度神经网的相似汉字识别[J].通信学报,2014,35(9):184-189. 被引量：29
3高学,温文欢,金连文.用于相似字识别的手写汉字特征优化方法[J].哈尔滨工程大学学报,2012,33(7):887-893. 被引量：3
4宫蓉蓉.基于SVM的手写体相似汉字识别[J].电脑与信息技术,2008,16(4):37-39.
5梁曼君,石竹.基于神经网络的相似汉字识别的研究[J].中文信息学报,1993,7(3):26-32. 被引量：1
6张德喜,郭超峰.基于人工神经网络的手写体相似汉字分类器的设计[J].河南城建高等专科学校学报,2001,10(3):27-29. 被引量：2
7肖明,曾莉.基于SVM汉字识别方法的特征分析[J].数字技术与应用,2011,29(10):154-155. 被引量：1
8张德喜,朱绍文,马少平.一种手写体相似汉字获取方法[J].计算机工程,1999,25(4):14-15. 被引量：2
9张德喜,赵秋雨.神经-模糊技术在相似汉字识别中的应用[J].许昌学院学报,2005,24(2):102-105.
10刘庆祥.对脱机手写相似汉字识别方法的研究[J].武昌理工学院学报,2012,7(3):141-143.

中文信息学报

2004年第2期

浏览历史

内容加载中请稍等...

基于不对称性的相似汉字识别方法

参考文献4

二级参考文献18

共引文献44

相关作者

相关机构

相关主题

浏览历史