基于子字单元的维吾尔语语音识别研究被引量：5

Research on Uyghur Speech Recognition Based on Subword Unit

下载PDF

导出

摘要为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。 To improve on accuracy of Uyghur speech recognition,based on analysis of Uyghur characteristics,the framework of Uyghur speech recognition based on subword is developed for the first time.Pronunciation model of Uyghur word is given.How to build subword pronouncing dictionary,subword language model and acoustic model is described.Experiments are completed on a speech corpus and an unsupervised Uyghur word segmentation method is utilized to produce subwords.Experimental results show that Uyghur speech recognition based on subword can gain better recognition results.

作者薛化建董兴华周喜吐尔洪.吾司曼李晓

机构地区中国科学院新疆理化技术研究所中国科学院研究生院

出处《计算机工程》 CAS CSCD 北大核心 2011年第20期208-210,共3页 Computer Engineering

基金中国科学院西部行动计划高新技术基金资助项目(KGCX2-YW-507)

关键词维吾尔语词切分子字单元隐马尔科夫模型连续语音识别 Uyghur word segmentation subword unit Hidden Markov Model（HMM） continuous speech recognition

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1李晨冲,董滨,潘复平,曾兴雯,颜永红.汉语普通话易混淆音素的识别[J].计算机工程,2009,35(23):201-203. 被引量：4
2陶梅,吾守尔.斯拉木,那斯尔江.吐尔逊.基于HTK的维吾尔语连续语音声学建模[J].中文信息学报,2008,22(5):56-59. 被引量：12
3那斯尔江.吐尔逊,吾守尔.斯拉木.基于隐马尔可夫模型的维吾尔语连续语音识别系统[J].计算机应用,2009,29(7):2009-2011. 被引量：17
4古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39
5Creutz, M, Lagus M. Unsupervised Models for Morpheme Segmentation and Morphology Learning[J]. ACM Transactions on Speech and Language Processing, 2007, 4(1): 3-36. 被引量：1
6Laila H H, Minker W. Evaluation of Text and Speech Systems[M]. [S. 1.]: Springer-Verlag, 2008. 被引量：1

二级参考文献13

1徐波,史晓东,刘群,宗成庆,庞薇,陈振标,杨振东,魏玮,杜金华,陈毅东,刘洋,熊德意,侯宏旭,何中军.2005统计机器翻译研讨班研究报告[J].中文信息学报,2006,20(5):1-9. 被引量：10
2石现峰,张学智,张峰.基于HTK的语音识别系统设计[J].计算机技术与发展,2006,16(10):37-38. 被引量：23
3BROWN P, COCKE J, PIETRA S, et al. A statistical approach to machine translation[J]. Computational Linguistics, 1990, 16(2):79 -85. 被引量：1
4KOEHN P, OCH F J, MARCU D. Statistical phrase-based translation[ C] // Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language. Morristown, N J: Association for Computational Linguistics, 2003:48 -54. 被引量：1
5OCH F J, NEY H. Discriminative training and maximum entropy models for statistical machine translation[ C]// Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Morristown, NJ: Association for Computational Linguistics, 2001: 295 - 302. 被引量：1
6STOLKE A. Srilm - An extensible language modeling toolkit [ EB / OL]. [ 2008 - 09 - 20]. http://web, iti. upv. es/-evidal/ students/doct/sht/transp/srlim2p, pdf. 被引量：1
7OCH F J, NEY H, A systematic comparison of various statistical alignment models[ J]. Computational Linguistics, 2003, 29(!) : 19 - 51. 被引量：1
8KOEHN P. Pharaoh: a beam search decoder for phrase-based statistical machine translation models[ EB/OL]. [ 2008 - 08 - 20]. http://www, iccs. inf. ed. ac. uk/- pkoehn/publications/pharaoh - amta2004, ps. 被引量：1
9Gulila·Adongbieke. The Research of Proofreading for the Uighur Character [A],The 2001 IEEE International Conference on System, Man and Cybernetics (SMC2001)[C], 2001.10.7 - . 10.10, Tucson, Arizona ,U.S.A,P874- 876. 被引量：1
10Steve Young, Julian Odell, et all. The HTK Book (for HTK Version g. 2)[R]. Cambridge University Engineering Department. 被引量：1

共引文献62

1琚四化.盲生与明眼生语音辨别的比较研究[J].南京特教学院学报,2010,0(3):21-23. 被引量：3
2许日俊,刘昌平.印刷体朝鲜文字符中字母的分割与识别研究[J].中文信息学报,2006,20(2):66-71. 被引量：2
3阿依克孜.卡德尔,开沙尔.卡德尔,吐尔根.依布拉音.面向自然语言信息处理的维吾尔语名词形态分析研究[J].中文信息学报,2006,20(3):43-48. 被引量：23
4赛麦提.麦麦提明.现代维吾尔语同形词词性自动标注探析[J].语言与翻译,2006(3):35-38. 被引量：1
5卢有飞,张伟,张岩,缪成,李春.维文版Office设计中关键技术的研究与实现[J].中文信息学报,2007,21(2):112-116. 被引量：7
6赵永进,郭大庆,卢有飞,李英凡.维文软件中排版关键技术的研究与实现[J].计算机工程与应用,2007,43(22):106-108. 被引量：8
7张伟,任大明,许晓辉,赵凡,张岩.维、哈、柯文显示及排版技术研究[J].计算机应用研究,2008,25(3):836-838. 被引量：4
8阿孜古丽.夏力甫.维吾尔语动词附加语素的复杂特征研究[J].中文信息学报,2008,22(3):105-109. 被引量：8
9玛依热.依布拉音,米吉提.阿不里米提,艾斯卡尔.艾木都拉.基于最小编辑距离的维语词语检错与纠错研究[J].中文信息学报,2008,22(3):110-114. 被引量：11
10米热古丽.艾力,米吉提.阿不力米提,艾斯卡尔.艾木都拉.基于词法分析的维吾尔语元音弱化算法研究[J].中文信息学报,2008,22(4):43-47. 被引量：17

同被引文献47

1古丽拉.阿东别克,米吉提.阿布力米提.维吾尔语词切分方法初探[J].中文信息学报,2004,18(6):61-65. 被引量：39
2贺苏宁,虞厥邦.几种小训练样本集的数字语音识别模型的比较性研究[J].计算机科学,2005,32(9):170-175. 被引量：1
3李锦,何培宇.一种改进的基于小波去噪HMM非特定人语音识别算法[J].四川大学学报（自然科学版）,2007,44(1):69-72. 被引量：12
4蔡琴,吾守尔.斯拉木.基于HTK的维吾尔语连续数字语音识别[J].现代计算机,2007,13(4):14-16. 被引量：7
5Arisoy E, Dutagaci H, Arslan L M. A unified language model for large vocabulary continuous speech recognition of Turkish[J]. Signal Processing, 2006, 86( 10): 2844-2862. 被引量：1
6Tanel A. Phonological and morphological modeling in large vocabulary continuous Estonian speech recognition system [C]//Proceedings of Second Baltic Conference on Human Language Technologies. Tallinn, Estonia, 2005: 89- 94. 被引量：1
7Creutz M, Lagus K. Unsupervised models for morpheme segmentation and morphology learning [J]. ACM Transactions on Speech and Language Processing, 2007, 4(1) : 3 - 36. 被引量：1
8Creutz M, Hirsimfiki T, Kurimo M, et al. Analysis of morph-based speech recognition and the modeling of out of vocabulary words across languages [C]// Proceedings of NAACL HLT. Rochester, NY, USA, 2007: 380-387. 被引量：1
9Hirsimaki T, Pylkkanen J, Kurimo M, et al. Importance of high order N-gram models in morph-based speech recognition [J]. IEEE Tra72sactions on Audio, Speech and Language Processing, 2009, 17(4):724-732. 被引量：1
10Ablimit M, Neubig G, Mimura M, et alo Uyghur morpheme-based language models and ASR [C]// Proc 10th IEEE Conf ICSP. Beiiing, China: IEEE Press, 2010:581 - 584. 被引量：1

引证文献5

1王苏敏,廖晶晶,赵秀鸟.基于DTW和HMM算法的语音识别系统对比研究[J].计算机光盘软件与应用,2012,15(11):56-56. 被引量：3
2努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木,热依曼.吐尔逊.基于音节的维吾尔语大词汇连续语音识别系统[J].清华大学学报（自然科学版）,2013,53(6):741-744. 被引量：5
3努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木,热依曼.吐尔逊.维吾尔语大词汇语音识别系统识别单元研究[J].北京大学学报（自然科学版）,2014,50(1):149-152. 被引量：4
4艾斯卡尔·肉孜,殷实,张之勇,王东,艾斯卡尔·艾木都拉,郑方.THUYG-20：免费的维吾尔语语音数据库[J].清华大学学报（自然科学版）,2017,57(2):182-187. 被引量：13
5穆凯代姆罕·伊敏江,艾斯卡尔·艾木都拉,米吉提·阿不里米提.基于CNN-HMM和RNN的维吾尔语语音识别[J].现代电子技术,2021,44(11):172-176. 被引量：3

二级引证文献24

1瓦依提.阿不力孜,加米拉.吾守尔,吐尔根.依布拉音,阿依佐克拉.瓦依提.现代维吾尔文音节自动切分方法及其实现[J].中国科技论文,2015,10(8):957-961. 被引量：2
2艾斯卡尔·肉孜,殷实,张之勇,王东,艾斯卡尔·艾木都拉,郑方.THUYG-20：免费的维吾尔语语音数据库[J].清华大学学报（自然科学版）,2017,57(2):182-187. 被引量：13
3徐健,热依曼.吐尔逊,吾守尔.斯拉木.在线多语种语音语料库平台的研究与实现[J].信息通信,2018,31(4):150-153. 被引量：3
4阿依先木.卡得尔,邱自成.维吾尔语三音素决策树的欠拟合调优[J].塔里木大学学报,2018,30(2):98-108.
5米尔阿迪力江·麦麦提,吾守尔·斯拉木,努尔麦麦提·尤鲁瓦斯,热依曼·吐尔逊,艾尼宛尔·托乎提.基于智能手机的维吾尔语语音控制系统的开发[J].计算机应用与软件,2016,33(6):220-223. 被引量：2
6王俊超,黄浩,徐海华,胡英.基于迁移学习的低资源度维吾尔语语音识别[J].计算机工程,2018,44(10):281-285. 被引量：6
7孙杰,吾守尔.斯拉木,热依曼.吐尔逊.基于CMN网络的低资源柯尔克孜语识别研究[J].现代电子技术,2018,41(24):132-136. 被引量：3
8孙玉,袁贞明,孙晓燕.基于Leap Motion的动态手势识别[J].计算机工程与应用,2019,55(13):151-157. 被引量：8
9朱俞清,章小兵,黄镇坤.多窗谱减法和EMD改进的新型能熵比端点检测[J].电声技术,2019,43(9):17-21. 被引量：2
10孙杰,王宏,吾守尔·斯拉木.结合注意力机制和因果卷积网络的维吾尔语方言识别[J].声学技术,2020,39(6):697-703. 被引量：3

1范正光,屈丹,闫红刚,张文林.借助音频数据的发音字典新词学习方法[J].西安交通大学学报,2016,50(6):75-82. 被引量：1
2俞振利,程伯中.基于语音生成和发音模型的语音合成新方法的探讨[J].声学学报,2000,25(5):455-462. 被引量：2
3侯丽敏,张吉庆.一种新型汉语语音声韵母切分方法[J].兰州大学学报（自然科学版）,1998,34(3):40-43.
4王尧,白雪飞,郭立,邓秋成.同步VLSI设计环境下AES模块的异步流水线结构实现[J].电子技术（上海）,2010(8):33-36.
5王唯良,樊养余,寇光兴,闫龙.最优二元自正交码[J].空军工程大学学报（自然科学版）,2015,16(1):85-88.
6掌明.无线传感器网络动态混合密钥管理方案研究[J].现代电子技术,2013,36(21):78-82.
7李兵虎,黄浩.新疆非母语汉语语音识别中的字典自适应技术[J].计算机工程与应用,2011,47(21):141-144.
8周红,黄晓涛,常玉林,周智敏.单通道UWB SAR地面运动目标变化检测[J].雷达科学与技术,2008,6(1):23-28.
9杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
10郭巧,张立伟,陆际联.用于汉语语音信号端点检测与切分的有效方法[J].计算机工程与应用,2000,36(5):92-94. 被引量：8

计算机工程

2011年第20期

浏览历史

内容加载中请稍等...

基于子字单元的维吾尔语语音识别研究被引量：5

参考文献6

二级参考文献13

共引文献62

同被引文献47

引证文献5

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于子字单元的维吾尔语语音识别研究 被引量：5

参考文献6

二级参考文献13

共引文献62

同被引文献47

引证文献5

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于子字单元的维吾尔语语音识别研究被引量：5