藏文识别的预处理被引量：20

A Preprocessing Algorithm for Tibetan Character Recognition

下载PDF

导出

摘要预处理是整个文字识别系统的重要组成部分，预处理性能的优劣将直接影响整个识别系统的性能。根据藏文在字形和书写方式上的特点，实现了一种适用于藏文识别的预处理技术，整个预处理过程包括二值化、版面分析、倾斜校正、字符切分和归一化。在预处理过程中还提取了一些有关字丁的基本特征，这些特征充分反映了藏文的特点，具有良好的稳定性，可以用于识别系统的粗分类和后处理。 The preprocessing is an important part of the character recognition system. Its performance will seriously affect the capacity of the system. In this paper, we present a preprocessing algorithm for Tibetan character based on the topology structures and writing habits of Tibetan characters. The entire preprocessing procedure includes binary, page analysis, skew correction, character segmentation and normalization. In addition, some basic features of Tibetan characters are extracted. These features can be used for recognition and postprocessing.

作者王浩军赵南元邓钢轶

机构地区清华大学自动化系

出处《计算机工程》 CAS CSCD 北大核心 2001年第9期93-96,共4页 Computer Engineering

关键词藏文识别预处理字符切分文字识别系统计算机 Tibetan character recognition Preprocessing Skew correction Character segmentation Normalization

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1张炘中.计算机汉字识别技术[J].语文建设,1992(10):34-38. 被引量：5

共引文献4

1冯志伟.汉字和汉语的计算机处理[J].当代语言学,2001,3(1):1-21. 被引量：23
2王强,马利庄.图像二值化时图像特征的保留[J].计算机辅助设计与图形学学报,2000,12(10):746-750. 被引量：65
3赵鹏飞,李铁威,马洁.前列腺癌的生物标记物——外分泌miRNAs[J].科技信息,2013(16):149-150.
4施伯乐,张亮,王勇,陈智峰.基于视觉相似性的中文古籍内容检索方法[J].软件学报,2001,12(9):1336-1342. 被引量：10

同被引文献132

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
3郑玉玲.藏语方言语音量化分析[J].民族语文,1998(5):42-50. 被引量：4
4共确降措.论藏文[J].西藏研究,1997(3):94-108. 被引量：7
5罗圣仪.计算机处理藏文的初步探讨[J].民族语文,1986(3):50-54. 被引量：3
6孙宏开,郑玉玲.计算机进行藏缅语语音相关分析的尝试[J].语言研究,1994,14(2):168-180. 被引量：3
7鲍怀翘,徐昂,陈嘉猷.藏语拉萨话语音声学参数数据库[J].民族语文,1992(5):10-20. 被引量：15
8张连生.计算机藏文文字处理的设计[J].民族语文,1983(5):37-43. 被引量：6
9于道泉.藏文数码代字[J].民族语文,1982(3):1-7. 被引量：3
10张连生.藏文号码代字及其计算机排索[J].语言研究,1983,3(2):35-40. 被引量：3

引证文献20

1王华,丁晓青.一种多字体印刷藏文字符的归一化方法[J].计算机应用研究,2004,21(6):41-43. 被引量：10
2吴永波,高岩,马利庄,张丘,丁裕锋.电子表格格式去除系统的研究[J].系统仿真学报,2004,16(11):2611-2613.
3陈丽娜,祁坤钰,贾彦民,吴健,康丽.藏文拉丁转写的研究与实现[J].计算机工程与设计,2006,27(1):15-17. 被引量：13
4吴刚,德熙嘉措,黄鹤鸣.印刷体藏文识别技术[J].青海师范大学学报（自然科学版）,2006,22(1):32-37. 被引量：8
5黄海凌,刘列根,张宇.彩色文档图像的版面分析[J].计算机工程,2008,34(15):231-233.
6小尼玛扎西.在通用字符集UCS中藏文编码模式的应用分析[J].西藏大学学报（社会科学版）,2008,23(2):16-20.
7欧珠,普次仁,大罗桑朗杰,赵栋才,刘芳,边巴旺堆.印刷体藏文文字识别技术研究[J].计算机工程与应用,2009,45(24):165-169. 被引量：12
8高定国,关白.回顾藏文信息处理技术的发展[J].西藏大学学报（社会科学版）,2009,24(3):18-27. 被引量：15
9范武英,张明亮,李积逊.基于动态聚类算法的藏文音节点检测[J].福建电脑,2011,27(2):108-110.
10周纬,陈良育,曾振柄.基于几何形状分析的藏文字符识别[J].计算机工程与应用,2012,48(18):201-205. 被引量：12

二级引证文献142

1华林,陈燕,刘凌慧子.藏族记忆构建视域下藏族档案数字资源跨业界整合研究[J].西藏民族大学学报（哲学社会科学版）,2021,42(2):52-60. 被引量：8
2贺胜,卢亚军,王正平.基于IMM-IME结构的藏文输入法研究[J].西北民族大学学报（自然科学版）,2008,29(1):29-32. 被引量：1
3尼玛扎西,李志蜀,群诺,普顿,拥措,陈安龙.一种在移动电话上实现藏文处理的方法[J].四川大学学报（工程科学版）,2009,41(1):162-167. 被引量：9
4多拉.藏语语义理解中功能性虚词研究[J].西藏大学学报（社会科学版）,2011,26(4):106-112. 被引量：4
5索南才让.面向自然语言处理的藏语虚词la格研究[J].西藏大学学报（社会科学版）,2013,28(5):48-52. 被引量：2
6仁青诺布,高红梅,王国宏,杨鹏,索朗旺堆.藏文在线输入法的设计与实现[J].西藏大学学报（社会科学版）,2013,28(4):65-69. 被引量：1
7周祥,李正明,孙俊.轮胎胎号字符识别系统[J].计测技术,2005,25(4):21-22.
8陈丽娜,祁坤钰,贾彦民,吴健,康丽.藏文拉丁转写的研究与实现[J].计算机工程与设计,2006,27(1):15-17. 被引量：13
9卢亚军.藏文计算机通用键盘布局与输入法研究[J].中文信息学报,2006,20(2):78-86. 被引量：18
10孙力.藏文古籍文献数据库系统建设的探讨[J].情报杂志,2006,25(7):143-144. 被引量：10

1王维兰,丁晓青,戴玉刚.藏文识别后处理研究[J].术语标准化与信息技术,2002(2):30-34. 被引量：10
2梁会方.基于GA-BP神经网络的脱机手写藏文识别方法[J].软件导刊,2013,12(9):79-80.
3周纬,陈良育,曾振柄.基于几何形状分析的藏文字符识别[J].计算机工程与应用,2012,48(18):201-205. 被引量：12
4祁坤钰.基于规则的藏文识别后处理研究[J].西北民族大学学报（自然科学版）,2003,24(4):33-36. 被引量：4
5孙淑娟,房培玉.基于蚁群算法的现代藏文字符轮廓提取技术研究[J].微计算机应用,2008,29(5):38-41. 被引量：3
6王维兰,丁晓青,祁坤钰.藏文识别中相似字丁的区分研究[J].中文信息学报,2002,16(4):60-65. 被引量：15
7赵冬香,赵晨星.脱机手写体藏文的特征提取[J].甘肃科技,2008,24(5):48-49. 被引量：1
8王浩军,赵南元,邓钢轶.一种现代藏文笔段提取算法[J].中文信息学报,2001,15(4):41-46. 被引量：11
9王维兰,丁晓青,陈力,王华.印刷体现代藏文识别研究[J].计算机工程,2003,29(3):37-38. 被引量：23
10王维兰.藏文基本字符识别算法研究[J].西北民族学院学报（自然科学版）,1999,20(3):20-23. 被引量：17

计算机工程

2001年第9期

浏览历史

内容加载中请稍等...

藏文识别的预处理被引量：20

参考文献1

共引文献4

同被引文献132

引证文献20

二级引证文献142

相关作者

相关机构

相关主题

浏览历史

藏文识别的预处理 被引量：20

参考文献1

共引文献4

同被引文献132

引证文献20

二级引证文献142

相关作者

相关机构

相关主题

浏览历史

藏文识别的预处理被引量：20