藏语孤立词语音识别技术研究被引量：6

Research on Tibetan isolated word speech recognition technology

下载PDF

导出

摘要针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通过循环迭代方法提高语音训练速度,利用藏文字母拉丁转写方法解决藏文和语音识别系统编码不一致的问题.在二次开发的HTK平台进行实验,正确率达到92.83%,实验结果表明元音特征在藏语音识别中起到重要作用. Aiming at Tibetan pronunciation firstly look after hong jia zi , then its pronunciation is determined by the position of vowel , and a vowel carry more auditory perception information than a consonant in speech ,a Tibetan isolated word speech recognition technology of improved HTK system is proposed in this paper . The accuracy of speech recognition is improved by increasing a formant parameter in the recognition characteristic parameters , the formant parameter can characterize vowel features very well , the speech training speed is raised by cycle iteration , Tibetan letters transformation Latin alphabet solves inconsistent problem that Tibetan and speech recognition system code . The test is executed on the secondary developing HTK platform , the correct rate reaches 92.83% . Experimental result indicates that vowel features play an important role in Tibetan speech recognition .

作者赵尔平王聪华党红恩雒伟群

机构地区西藏民族大学信息工程学院

出处《西北师范大学学报（自然科学版）》 CAS 北大核心 2015年第5期50-54,共5页 Journal of Northwest Normal University(Natural Science)

基金国家自然科学基金资助项目(61162025) 西藏自治区自然科学基金资助项目(12KJZRYMY07) 西藏自治区科技厅重点项目(藏科发[2013]189号) 西藏民族学院重大科研项目(11myZ05)

关键词藏语孤立词共振峰 M el倒谱特征循环迭代隐马尔可夫模型语音识别 Tibetan isolated word formant Mel cepstrum features loop iteration HMM speech recognition

分类号 TP912.34 [自动化与计算机技术]

引文网络
相关文献

参考文献16

1王川,段德全,王晓东.基于改进的PSO和HMM的Web信息抽取算法[J].河南师范大学学报（自然科学版）,2010,38(5):65-68. 被引量：3
2魏巍,张海涛.一种基于HTK的数字语音识别系统[J].计算机系统应用,2011,20(9):17-21. 被引量：6
3李冠宇,孟猛.藏语拉萨话大词表连续语音识别声学模型研究[J].计算机工程,2012,38(5):189-191. 被引量：16
4于洪志,高璐,李永宏,郑文思.藏语机读音标SAMPA_ST的设计[J].中文信息学报,2012,26(4):66-72. 被引量：9
5刘博,杨鸿武,甘振业,郭威彤.利用SAMPA实现藏语的字音转换[J].计算机工程与应用,2011,47(35):117-121. 被引量：3
6COLE R A, YANG Hong-yan, MAK B, et al. The contribution of consonants versus vowels to word recognition in fluent speech [ C]//Proc ICASSP 1996. Atlanta: IEEE, 1996: 853. 被引量：1
7KEWLEY-PORT K, BURKLE Z, LEE Jae Hee. Contribution of consonant versus vowel information to sentenceintelligibility for young normal-hearing and elderly hearing-impairedlisteners [J]. Acoustical Society of America, 2007, 122(4): 2365. 被引量：1
8LEWICHI M S. A signal take on speech [J].Nature, 2010, 466(12): 821. 被引量：1
9颜永红,李军锋,应冬文.语音中元音和辅音的听觉感知研究[J].应用声学,2013,32(3):231-236. 被引量：7
10赵力编著..语音信号处理[M].北京:机械工业出版社,2003:316.

二级参考文献93

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2共确降措.论藏文[J].西藏研究,1997(3):94-108. 被引量：7
3胡坦.藏语(拉萨话)声调研究[J].民族语文,1980(1):22-36. 被引量：48
4谭克让,孔江平.藏语拉萨话元音、韵母的长短及其与声调的关系[J].民族语文,1991(2):12-21. 被引量：26
5孔江平.藏语（拉萨话）声调感知研究[J].民族语文,1995(3):56-64. 被引量：43
6黄布凡.藏语方言声调的发生和分化条件[J].民族语文,1994(3):1-9. 被引量：27
7段磊,唐常杰,左劼,陈宇,钟义啸,元昌安.基于基因表达式编程的抗噪声数据的函数挖掘方法[J].计算机研究与发展,2004,41(10):1684-1689. 被引量：39
8陈肖霞.连续话语语料库的语音切分和标记[J].语言文字应用,2000(2):78-82. 被引量：6
9元昌安,唐常杰,左劼,谢方军,陈安龙,胡建军.基于基因表达式编程的函数挖掘——收敛性分析与残差制导进化算法[J].四川大学学报（工程科学版）,2004,36(6):100-105. 被引量：44
10高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量：33

共引文献93

1王坤赤,蒋华.一种基于语音频谱的基频和共振峰提取算法[J].信息技术,2007,31(10):20-22. 被引量：2
2金慧敏,廖燕莎,史菁,陈琪.藏语方言计算机辅助系统的研究[J].科技信息,2009(1).
3王晓亚,鲁玉海.语音的端点检测处理技术[J].无线电工程,2010,40(2):16-18. 被引量：7
4赵毅,尹雪飞,陈克安.一种新的基于倒谱的共振峰频率检测算法[J].应用声学,2010,29(6):416-424. 被引量：9
5王立忠.基于VC5409的双速率语音编译码器的实现[J].无线电通信技术,2006,32(2):18-20.
6方杰,李英.一种语音信号对数幅度谱包络的无偏算法[J].江南大学学报（自然科学版）,2006,5(2):195-198.
7余伶俐,蔡自兴,陈明义.语音信号的情感特征分析与识别研究综述[J].电路与系统学报,2007,12(4):76-84. 被引量：27
8梁颂朗.基于去噪的ACF-CEP基音检测算法[J].中国科技信息,2008(12):37-38. 被引量：1
9李永宏,杨阳蕊,柳春,于洪志.基于字词处理的藏文文本分析系统[J].语文学刊（高等教育版）,2009(1):82-84.
10黄丽雯,郭小渝.摩托车电喇叭声音性能分析方法研究[J].机电工程,2009,26(2):85-87. 被引量：2

同被引文献71

1德庆卓玛.藏语语音识别研究综述[J].西藏大学学报（社会科学版）,2010,25(S1):192-195. 被引量：5
2杨昌盛.贵州三都苗语语音系统及其与苗语中部方言标准音的对应规律[J].西南民族大学学报（人文社会科学版）,1999,20(5):33-37. 被引量：1
3姬安龙.摆省苗语音系及其语音特点[J].贵州民族研究,1997,17(4):149-152. 被引量：2
4石德富.排烧苗语的语音特点[J].贵州民族学院学报（哲学社会科学版）,2005(6):39-43. 被引量：2
5武光利,戴玉刚,马宁.基于短时平均幅度和短时平均过零率的藏语语音端点检测研究[J].福建电脑,2007,23(3):116-116. 被引量：4
6李勇,于洪志,达哇彭措.基于关联规则的藏语语音韵律参数提取[J].微计算机信息,2009(6):255-257. 被引量：3
7姚徐,李永宏,单广荣,于洪志.藏语孤立词语音识别系统研究[J].西北民族大学学报（自然科学版）,2009,30(1):29-36. 被引量：10
8王昆仑,张贯虹,吐尔洪江.阿布都克力木.维吾尔语元音的声频特性分析和识别[J].中文信息学报,2010,24(2):122-128. 被引量：10
9金哲俊.关于朝鲜族男生的朝鲜语单元音共振峰的特征研究[J].东疆学刊,2010,27(2):74-77. 被引量：2
10李永宏,于洪志,孔江平.藏语连续语音语料库设计与实现[J].计算机工程与应用,2010,46(13):233-235. 被引量：10

引证文献6

1王桂荣,金小峰.基于计算语音方法的朝蒙单元音对比研究[J].吉林大学学报（信息科学版）,2019,37(1):68-74. 被引量：1
2刘琼.几种开源英语识别工具包的对比分析[J].计算技术与自动化,2018,37(4):123-127. 被引量：3
3王福钊,周雁.藏语语音识别研究进展和展望[J].计算机系统应用,2020,29(3):29-38. 被引量：2
4贾嘉敏,潘文林.基于改进Inception-ResNet_v2的低资源少数民族语音识别[J].软件导刊,2022,21(8):51-55. 被引量：2
5边巴旺堆,王希,王君堡.藏语语音识别研究进展综述[J].高原科学研究,2022,6(4):76-84. 被引量：3
6袁子林,张瑞,张彩霞,魏欢,巩海平.民族语言的语音识别研究[J].计算机应用文摘,2024,40(1):81-83.

二级引证文献11

1冯乐乐,王昆,郝冲,赵阳.语音识别技术在智能作业指导书系统中的应用[J].电声技术,2023,47(1):105-109.
2赵冬梅,王林,李学林,刘秋会.水语元音声学特性分析及识别[J].现代信息科技,2020,4(4):17-19.
3王欣欣,马发民.一种基于DNN的少儿英语口语评分系统的改进[J].信息技术,2020,44(9):46-50. 被引量：5
4王凯,马明栋.基于Kaldi的语音识别[J].计算机技术与发展,2021,31(1):13-17. 被引量：4
5郝焕香.基于深度学习的方言语音识别模型构建[J].自动化与仪器仪表,2022(4):48-51. 被引量：3
6霍伟明,徐浩.用于大词汇量语音识别的门控残差DFSMN声波模型[J].家电科技,2022(5):22-25. 被引量：2
7贡保加,才智杰,才让卓玛,彭毛扎西.一种藏语语音识别中数字文本规范方法[J].高原科学研究,2022,6(3):117-124. 被引量：1
8蔡优新,边巴旺堆.基于双向GRU模型的藏语语音情感识别[J].信息技术与信息化,2023(10):209-213. 被引量：1
9黄泽,毕贵红,谢旭,赵鑫,陈臣鹏,张梓睿,骆钊.基于MBI-PBI-ResNet的超短期光伏功率预测[J].电力系统保护与控制,2024,52(2):165-176. 被引量：1
10张恒,拉巴顿珠,官政先,肖鑫.基于深度神经网络的藏语语音关键词检索方法[J].西藏科技,2024,46(6):73-80.

1缴春芳,尹业安,梁玉营.基于MFCC和BP神经网络的说话人识别研究[J].网友世界,2013(4):37-37.
2陆飞,程明,葛炜.基于ARM的语音识别系统的设计与实现[J].微计算机信息,2008,24(26):79-80. 被引量：4
3徐毅,周敏.基于VB的孤立词语音识别的实现[J].电脑开发与应用,2013,26(7):71-72.
4杨熙.基于DTW改进算法的孤立词语音识别仿真与分析[J].湖南科技学院学报,2015,36(10):41-42. 被引量：1
5徐利军.基于DTW的孤立词语音识别研究[J].软件导刊,2012,11(2):137-139. 被引量：6
6王彪,杨志明,杨小东,黄海宁,田杰.基于倒谱特征的舰船辐射噪声识别算法研究[J].西北师范大学学报（自然科学版）,2006,42(6):34-35.
7刘静,王儒,曲金玉,李东荣.基于DTW改进算法的孤立词语音识别仿真[J].山东理工大学学报（自然科学版）,2013,27(1):63-66. 被引量：3
8唐永锋,霍春宝.噪声环境下语音信号端点检测算法的研究与改进[J].电脑知识与技术,2007(6):1386-1387. 被引量：1
9马国庆,刘丽,于正林,曹国华.一种用于并联机器人运动学求解的循环迭代方法[J].长春理工大学学报（自然科学版）,2016,39(1):42-47. 被引量：1
10郭莉莉.ARM语音识别控制器在智能家居中的应用[J].硅谷,2015,8(2):264-265.

西北师范大学学报（自然科学版）

2015年第5期

浏览历史

内容加载中请稍等...

藏语孤立词语音识别技术研究被引量：6

参考文献16

二级参考文献93

共引文献93

同被引文献71

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

藏语孤立词语音识别技术研究 被引量：6

参考文献16

二级参考文献93

共引文献93

同被引文献71

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

藏语孤立词语音识别技术研究被引量：6