基于汉语语音音位的HMM建模方法被引量：1

HMM modeling based on mandarin phonemes in embedded systems

导出

摘要为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母2部分建立的半音节隐含M arkov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。 A method of acoustic model design was developed for Hidden Markov Models to reduce the complexity of the acoustic models and lower the hardware requirements in embedded systems. The method separately models each initial, glide, nucleus, and coda phoneme. The model numbers of these four parts were 76, 12, 76, and 14, and thestate numbers of each model of these four parts were 4, 1, 4, and 2 in the final system based on the knowledge of mandarin phonemes and the results of scheme comparison tests. The total number of models was reduced by 30.2% with the number of states was reduced by 36.5%. The keyword detection accuracy was improved by 1.32% compared with the method of modeling each initial and final semi-syllable.

作者何珏刘加

机构地区清华大学深圳研究生院电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2007年第4期518-521,共4页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目(60272016)

关键词声学模型隐含Markov模型语音识别 acoustic model hidden Markov model speech recognition

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1刘叔新主编..现代汉语理论教程[M].北京:高等教育出版社,2002:501.
2Rose R,Paul D.A hidden Markov model based keyword recognition system[C]∥ ICASSP.Albuquerque,1990:129-132. 被引量：1
3Lee C-H,Rabiner L,Pieraccini R,et al.Acoustic modeling for large vocabulary speech recognition[J].Computer Speech and Language,1990,4(2):127-165. 被引量：1
4李净,郑方,张继勇,吴文虎.汉语连续语音识别中上下文相关的声韵母建模[J].清华大学学报（自然科学版）,2004,44(1):61-64. 被引量：18
5邵敬敏..现代汉语通论[M]..上海:上海教育出版社,,1991,4..55.. 被引量：1
6Yong S,Kershaw D,Odell J,et al.The HTK Book[EB/OL].2002.http://htk.eng.cam.ac.uk. 被引量：1
7中国国家对外汉语教学领导小组办公室-汉语语音与语音教学韵母的分类[EB/OL].2005.厦门大学海外教育学院.http://oec.xmu.edu.cn/yuyin/03/03-01.htm 被引量：1
8LIU Chimin,CHIU Chinchih,CHANG Hungyuan.Design of vocabulary-independent mandarin keyword spotters[J].IEEE Transactions on Speech and Audio Processing,2000,8(4):483-487. 被引量：1

二级参考文献8

1Lee C-H, Rabiner L, Pieraccini R, et al. Acoustic modeling for large vocabulary speech recognition [J]. Computer Speech and Language, 1990, 4(2): 127-165. 被引量：1
2Young S J, Woodland P C. Tree-based state tying for high accuracy acoustic modeling [A]. Proc ARPA Human Language Tech Workshop [C]. Plainsboro, NJ: Morgan Kaufmann Publisher, 1994, 307-312. 被引量：1
3Reichl W, Chou W. Decision trees state tying based on segmental clustering for acoustic modeling [A]. Proc Int Conf Acoustics, Speech, Signal Processing'98 [C]. Seattle, Washington: IEEE Press, 1998. 801-804. 被引量：1
4Reichl W, Chou W. Robust decision tree state tying for continuous speech recognition [J]. IEEE Trans Speech and Audio Proc, 2000, 8(5): 555-566. 被引量：1
5曹剑芬.现代语音基础知识 [M].北京: 人民教育出版社,1990.. 被引量：1
6ZHENG Fang, SONG Zhanjiang, XU Mingxing. EASYTALK: A large-vocabulary speaker-independent Chinese dictation machine [A]. EuroSpeech '99 [C]. Budapest, Hungary: ISCA, 1999, 819-822. 被引量：1
7Yong S, Kershaw D, Odell J, et al. The HTK Book [EB/OL]. http://htk.eng.cam.ac.uk, 2002. 被引量：1
8郑方,牟晓隆,徐明星,武健,宋战江.汉语语音听写机技术的研究与实现[J].软件学报,1999,10(4):436-444. 被引量：6

共引文献17

1贾珈,蔡莲红,李明,张帅.汉语普通话与沈阳方言转换的研究[J].清华大学学报（自然科学版）,2009(S1):1309-1315. 被引量：7
2张辉,杜利民.汉语连续语音识别中不同基元声学模型的复合[J].电子与信息学报,2006,28(11):2045-2049. 被引量：7
3潘玉春,徐明星,贾培发.面向情感语音识别的建模方法研究[J].计算机科学,2007,34(1):163-165. 被引量：1
4方贵明.汉语拼音的短韵母编码与汉字输入[J].中文信息学报,2007,21(1):74-78.
5崔文迪,黄关维.语音识别综述[J].福建电脑,2008,24(1):28-29. 被引量：7
6孙成立,刘刚,郭军.中文语音确认中子词置信度性能的研究[J].中文信息学报,2008,22(2):106-109. 被引量：2
7苏敏,李战明.基于模糊粗神经网络的汉语声韵母切分[J].电声技术,2008,32(9):49-51. 被引量：1
8王昆仑,张贯虹,吐尔洪江.阿布都克力木.维吾尔语元音的声频特性分析和识别[J].中文信息学报,2010,24(2):122-128. 被引量：10
9邵健,赵庆卫,颜永红.基于鼻韵尾分离的汉语声韵母识别模型[J].声学学报,2010,35(5):587-592. 被引量：3
10王艳,冯宏伟,张利平,忽满利.基于元音检测的汉语连续语音声韵母分割[J].计算机工程与应用,2011,47(14):134-136. 被引量：7

同被引文献9

1肖勇,覃爱娜.改进的HMM和小波神经网络的抗噪语音识别[J].计算机工程与应用,2010,46(22):162-164. 被引量：9
2江铭虎,朱小燕,袁保宗.语音识别与理解的研究进展[J].电路与系统学报,1999,4(2):53-59. 被引量：6
3张君昌,陈媛媛.基于改进KPCA的语音特征提取方法[J].计算机仿真,2011,28(6):393-396. 被引量：3
4秦涵书,魏延,曾绍华.一种基于小生境遗传算法的SVM参数优化方法[J].重庆理工大学学报（自然科学）,2011,25(12):89-93. 被引量：4
5黄景德,郝学良,王明.基于HMM的多态系统状态识别模型研究[J].测试技术学报,2012,26(2):154-157. 被引量：4
6姚敏锋,李心广,杨佳能.基于语音特征聚类的HMM语音识别系统研究[J].微计算机信息,2012,28(10):458-460. 被引量：6
7高洪元,曹金龙.认知无线电中的量子蛙跳频谱分配[J].应用科学学报,2014,32(1):19-26. 被引量：3
8范玉刚,张亚雄,吴建德,黄国勇,王晓东.基于在线LS-SVM的逆模/PID复合控制[J].控制工程,2014,21(6):954-957. 被引量：2
9林茜,欧建林,蔡骏.基于Microsoft Speech SDK的语音关键词检出系统的设计和实现[J].心智与计算,2007,0(4):433-441. 被引量：15

引证文献1

1高家宝,来羽.一种新的HMM/SVM混合语音识别模型[J].控制工程,2016,23(11):1802-1807. 被引量：6

二级引证文献6

1徐必伟,苏成利,杨微,曹江涛.基于DTW和EMD的孤立词语音识别研究[J].辽宁石油化工大学学报,2018,38(1):74-78. 被引量：2
2高成吉.一种英语口语识别算法[J].信息技术,2018,42(8):148-151. 被引量：3
3刘琼.几种开源英语识别工具包的对比分析[J].计算技术与自动化,2018,37(4):123-127. 被引量：3
4杜淼,黄天淏,边彤,颜逸为,余勤,雒瑞森.基于隐马尔科夫模型集成学习的广播关键词检测[J].河南科技,2019,0(35):8-11.
5王前,王刚,蒋晗晗,陈尚卿.基于MFCC与CDET的滚动轴承故障诊断方法研究[J].控制工程,2019(9):1682-1686. 被引量：5
6周挺,杨荣.多媒体网络语音音调数据特征智能识别方法[J].自动化与仪器仪表,2019(9):132-135. 被引量：1

1张秋余,赵彦敏,李建海.基于汉语语音音位的非特定人命令词识别算法研究[J].科学技术与工程,2008,8(8):2004-2006.
2D.W.J.斯坦姆,G.M.迪拉德.将隐含Markov模型应用于杂波中的雷达检测[J].雷达与对抗,1998(2):20-26.
3周德全,郭耀红.用HMM框架下的神经网络分类器识别雷达目标[J].红外与毫米波学报,2001,20(2):107-110. 被引量：1
4丁沛,曹志刚.融合语音增强与后续补偿的抗噪声语音识别方法[J].清华大学学报（自然科学版）,2003,43(7):919-922. 被引量：5
5刘敬伟,王作英,肖熙.基于自回归模型的加性噪声环境稳健语音识别[J].清华大学学报（自然科学版）,2006,46(1):50-53. 被引量：2
6吴及,肖熙,许琳,王作英.非凸段长分布隐含Markov模型的搜索算法[J].清华大学学报（自然科学版）,2005,45(7):924-927.
7邝继顺,何鎏藻.汉语语音识别策略的研究[J].湖南大学学报（自然科学版）,1993,20(2):33-39.
8李鹏,智强,董明,梁维谦,刘润生.嵌入式语音识别Mahalanobis距离计算模块[J].清华大学学报（自然科学版）,2008,48(7):1202-1204. 被引量：2
9梁维谦,王国梁,刘加,刘润生.基于音素的发音质量评价算法[J].清华大学学报（自然科学版）,2005,45(1):5-8. 被引量：12
10赵庆卫,王作英.利用段长信息的改进连续语音识别算法[J].清华大学学报（自然科学版）,1997,37(10):87-90. 被引量：5

清华大学学报（自然科学版）

2007年第4期

浏览历史

内容加载中请稍等...

基于汉语语音音位的HMM建模方法被引量：1

参考文献8

二级参考文献8

共引文献17

同被引文献9

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于汉语语音音位的HMM建模方法 被引量：1

参考文献8

二级参考文献8

共引文献17

同被引文献9

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于汉语语音音位的HMM建模方法被引量：1