摘要
在一个国际化的环境中 ,各种语言 (language)、文字 (script)需要识别和处理 .在这篇文章中 ,提出了一种基于多尺度非冗余小波纹理分析的文字种类自动识别技术 .在实验中选用了六种语言 (中文、英文、日文、韩文、俄文和印度文 )不同格式和字体的文本图像 ,以证实这种技术的能力 .计算复杂性分析和实验表明 :基于多尺度非冗余小波纹理分析的文字种类自动识别技术 ,具有较小的计算复杂性 ,而且对格式和字体的变化较稳定 .
There are variety languages or scripts need to identify and process in an international environment. This paper proposes a script identification technique based on multi scale non redundant wavelet texture analysis. The authors choose six language (Chinese, English, Japanese, Korean, Russian and Indian) script samples with different formats and fonts to demonstrate the potential of the technique. Computational complexity analysis and experiments show that multi scale non redundant wavelet texture based script identification method has less computational complexity and more stability for the variety of format or font.
出处
《计算机学报》
EI
CSCD
北大核心
2000年第7期699-704,共6页
Chinese Journal of Computers
关键词
文字种类
自动识别
多尺度小波
纹理分析
script, identification, multi-scale wavelet, texture analysis