HCL2000手写汉字数据库的更新及相关研究被引量：4

The New Edition of HCL2000 and its Application

下载PDF

导出

摘要 HCL2000是目前最具影响力的手写汉字数据库之一,基于研究手写汉字规律的设计初衷,该数据库采用了以书写者为单位按文件形式组织和存放的方式。本文则从研究样本选择的应用角度出发,对HCL2000中的样本进行了重新组织,同时对该数据库中的错误进行了纠正,生成了一个新的手写汉字数据库HCL2004。文章最后基于HCL2004数据库和方向线素特征进行了有关训练样本数对识别性能影响的研究,给出了3755类大字符集情况下的最佳训练样本数为300的结论,同时还对识别过程中的样本选择问题进行了探讨。 HCL2000 is one of the most influential handwritten Chinese characters databases. In order to research the nature features of handwritten Chinese characters, the files of database are organized in the mode of the writers. But this form of the files organization is not always the most effective in other researches such as the research on pattern selection. By this reason, a new model of characters database is developed. Based on the new model and HCL2000, a newly edited version of HCL2000- HCL2004 is developed by reorganizing and revising the samples. Then two experiments are arranged. One is focused on the effect of the number of the training samples. From this experiment, we can see the relation of the number of the training samples and the system performance. And for 3755 characters classes, to achieve the optimal system performance need 300 training samples of each character. The other experiment in the paper is about the seleetion of the training and testing samples.

作者任俊玲郭军

机构地区北京邮电大学信息工程学院

出处《中文信息学报》 CSCD 北大核心 2005年第5期97-104,共8页 Journal of Chinese Information Processing

基金教育部跨世纪人才基金和教育部重点科研项目资助(02029)

关键词人工智能模式识别 HCL2000 手写汉字数据库样本选择 HCL2004 artificial intelligence pattern recognition HCL2000 handwritten Chinese characters database pattern selection HCL2004

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1郭军,蔺志青,张洪刚.一个新的脱机手写汉字数据库模型及其应用[J].电子学报,2000,28(5):115-116. 被引量：15
2蔺志青,郭军.一种相似汉字的识别算法[J].中文信息学报,2002,16(5):44-48. 被引量：14
3Christopher, J.C. Burges, A Tutorial on Support Vector Machines for Pattern Recognition [J]. Data Mining and Knowledge Discovery, 1998,2(2): 121 - 167. 被引量：1
4B.B. Chaudhuri, How to Choose a Representative Subset from a Set of Data in Multi - dimensional Space [J]. Pattern Recognition Lett. 被引量：1
5B.H. Juang and S. Katagiri, Discriminative Learning for Minimum Error Classification[A]. IEEE Trans. Signal Proeessing[C], Dec. 1992. 被引量：1
6Vladimir N Vapnik.统计学习理论的本质[M].北京:清华大学出版社,2003,9.. 被引量：1
7边肇祺等编著..模式识别第2版[M].北京:清华大学出版社,2000:338.
8Jun Guo, Ning Sun, Y. Nemoto, Recognition of Handwritten Characters Using Pattern Transformation Method with Cosine Function[ C]. IEICE. Vol. J76- D- Ⅱ, No.4, 1993, 835 - 842. 被引量：1
9Trier O D, Jain A K, Taxt T, Feature Extraction Methods for Character Recognition- A Survey [J]. Pattern Recognition, 1996, 29(4): 641 - 662. 被引量：1

二级参考文献5

1郭军,马跃,盛立东,钟义信.发展中的文字识别理论与技术[J].电子学报,1995,23(10):184-187. 被引量：21
2Guo J，IEICE Japan Trans，1993年，J76DⅡ卷，4期，835页被引量：1
3刘迎建，第四届全国汉字及汉语语音识别学术会议论文集，1992年，5卷，35页被引量：1
4黎明刚,郭军.基于伪MMX技术的并行识别算法及其应用[J].中文信息学报,2000,14(1):27-31. 被引量：3
5郭军,蔺志青,张洪刚.一个新的脱机手写汉字数据库模型及其应用[J].电子学报,2000,28(5):115-116. 被引量：15

共引文献26

1封筠,王彦芳,杨扬,王小平,刘永军.SVM多值分类器在脱机手写体相似汉字识别中的应用[J].计算机工程与应用,2004,40(27):200-202. 被引量：8
2金连文,高学.几种手写体汉字网格方向特征提取法的比较研究[J].计算机应用研究,2004,21(11):38-40. 被引量：10
3吴锐,刘家锋,唐降龙,孙广玲.基于Gabor小波变换的汉字识别方法[J].高技术通讯,2005,15(3):7-10. 被引量：4
4孙权森,金忠,王平安,夏德深.一种有效的手写体汉字组合特征的抽取与识别算法[J].中文信息学报,2005,19(4):78-83. 被引量：2
5封筠,杨扬,朴春慧.一种手写相似汉字特征选择方法的研究[J].计算机工程,2005,31(15):33-34.
6陈增照,杨扬,董才林,何秀玲.支持向量机动态学习方法及其在票据识别中的应用[J].北京科技大学学报,2006,28(2):199-202. 被引量：3
7任俊玲,郭军,王承权.基于分位数的手写汉字识别方法[J].计算机工程与应用,2006,42(11):45-47.
8喻莹,杨扬,董才林.基于动态特征选择的手写体相似汉字的识别[J].计算机工程,2006,32(17):10-11.
9陈光,张洪刚,郭军.一种新的加权动态网格汉字特征抽取方法[J].中文信息学报,2007,21(2):89-93. 被引量：2
10林民,宋柔.一种面向构形计算的汉字字形形式化描述方法[J].中文信息学报,2008,22(3):115-123. 被引量：7

同被引文献37

1曾铭,俞俊生,刘绍华.一种用于社交网站的云安全敏感信息过滤模型[J].华中科技大学学报（自然科学版）,2012,40(S1):211-214. 被引量：4
2郭军,马跃,盛立东,钟义信.发展中的文字识别理论与技术[J].电子学报,1995,23(10):184-187. 被引量：21
3刘伟,朱宁波,何浩智,李德鑫,孙发军.基于弹性网格模糊特征的手写体汉字识别方法[J].中文信息学报,2007,21(3):117-121. 被引量：10
4S Mori,K Yamamoto,M Yasuda.Research on machine recognition of handprinted characters[J].IEEE Trans,1984,PAMI-6(4):386-405. 被引量：1
5T W Hildebrand,W Liu.Optical recognition of handwritten Chinese characters:advances since 1980[J].Pattern Recognition,1993,26(2):205-225. 被引量：1
6N Kato,M Suzuki,S Omachi.A handwritten character recognition system using directional element feature and asymmetric mahalanobis distance[J].IEEE Trans,1999,PAMI-21(3):258-262. 被引量：1
7J Guo,N Sun,Y Nemoto,R Sato.Recognition of handwritten characters using pattern transformation method with Cosine function[A].IEICE[C].J76-D-II,No.4,1993.835-842. 被引量：1
8J Guo,N Sun,Y Nemoto,R Sato.Recognition of handwritten character database ETL9B using pattern transformation method[J].IEICE Trans,1993,J76-D-II(5):1015-1022. 被引量：1
9N Sun,J Guo,Y Nemoto,R Sato.A new algorithm of handwritten character recognition by estimating the standard deviation of input pattern[J].IEICE Trans,1994,J77-D-II(1):79-90. 被引量：1
10Srihari S N, Yang Xuanshen, Ball G R. Offline Chinese Handwriting Recognition: A Survey[M]. Beijing: Higher Education Press, 2007. 被引量：1

引证文献4

1任俊玲,郭军.包含高阶统计量的手写汉字分类尺度[J].电子学报,2005,33(10):1876-1878. 被引量：1
2何志国,曹玉东.脱机手写体汉字识别综述[J].计算机工程,2008,34(15):201-204. 被引量：9
3吕振伟.一种新的手写汉字生成方法[J].太原大学学报,2014,15(3):131-134. 被引量：1
4刘伟,何瑶,仵晨阳,张悦健,张滏钰.一种面向网络安全的图像文字敏感词过滤方法[J].西安邮电大学学报,2018,23(4):89-93. 被引量：5

二级引证文献16

1孙华,张航.汉字识别方法综述[J].计算机工程,2010,36(20):194-197. 被引量：28
2訾兴建,王建平.基于小波变换的图像汉字笔划特征提取方法[J].计算机工程与应用,2012,48(12):168-172. 被引量：2
3訾兴建,王建平.手写体汉字八形态编码识别方法的研究[J].淮北师范大学学报（自然科学版）,2012,33(2):38-42.
4何滔,赵莹莹.一种改进的基于ART2神经网络的文字识别算法[J].桂林电子科技大学学报,2012,32(3):237-239. 被引量：1
5祝双武,郝重阳.基于纹理周期性分析的织物疵点检测方法[J].计算机工程与应用,2012,48(21):163-166. 被引量：17
6赵冬香.基于ART2神经网络的脱机手写吾美藏文基字识别[J].电子技术与软件工程,2013(15):14-14. 被引量：1
7王秀娟,相从斌.基于累积量的DoS攻击检测算法[J].北京工业大学学报,2017,43(9):1328-1334. 被引量：3
8高通,雷雪梅.基于FPGA的汉字识别系统[J].内蒙古大学学报（自然科学版）,2018,49(3):315-321. 被引量：1
9朴承哲.基于改进深度学习的网络敏感信息快速过滤研究[J].宁夏师范学院学报,2021,42(1):85-90. 被引量：2
10黄子君,陈琪,罗文兵.基于深度学习的汉字生成方法[J].计算机工程与应用,2021,57(17):29-36. 被引量：4

1郭军,蔺志青,张洪刚.一个新的脱机手写汉字数据库模型及其应用[J].电子学报,2000,28(5):115-116. 被引量：15
2童学锋,朱俊.大字符集脱机手写体汉字识别粗分类问题[J].计算机应用,2006,26(B06):24-26. 被引量：2
3任俊玲,郭军,王承权.基于分位数的手写汉字识别方法[J].计算机工程与应用,2006,42(11):45-47.
4陈红兵,薛雷波,张立军.图像处理技术在带钢缺陷检测中的应用[J].宁波化工,2014(2):31-37.
5王之怡,杨一帆.多分类簇支持向量机方法[J].计算机应用,2010,30(1):143-145. 被引量：1
6高学,金连文,尹俊勋,黄建成.基于笔划的手写体汉字方向分解特征提取方法[J].华南理工大学学报（自然科学版）,2003,31(3):11-14. 被引量：6
7任俊玲.基于广义置信度的样本选择算法[J].中文信息学报,2007,21(3):106-110. 被引量：4
8申丰山,王黎明,张军英.基于SVM技术的精简极速学习机[J].华中科技大学学报（自然科学版）,2014,42(6):107-110. 被引量：6
9姚超,卢朝阳,李静,姜维,范志辉.一种分类器级联的手写相似汉字识别方法[J].西安电子科技大学学报,2015,42(5):26-32. 被引量：6
10姚超,卢朝阳,李静,姜维.用于手写文字识别的MQDF替代参数选择方法[J].华中科技大学学报（自然科学版）,2014,42(12):65-69. 被引量：1

中文信息学报

2005年第5期

浏览历史

内容加载中请稍等...

HCL2000手写汉字数据库的更新及相关研究被引量：4

参考文献9

二级参考文献5

共引文献26

同被引文献37

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

HCL2000手写汉字数据库的更新及相关研究 被引量：4

参考文献9

二级参考文献5

共引文献26

同被引文献37

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

HCL2000手写汉字数据库的更新及相关研究被引量：4