考虑状态持续时间的改进Viterbi算法及语音识别被引量：3

An Improved Viterbi Algorithm and Speech Recognition with State Duration Considered

下载PDF

导出

摘要针对考虑状态持续时间的 HMM,在非线性动态规划的基础上设计了改进的 Viterbi算法 ,并给出了 Viterbi算法和 K- means聚类相结合的语音识别过程 ,最后分别以一般和考虑状态持续时间的 HMM及 Viterbi算法对 50个汉语音节进行了识别实验。结果表明 ,考虑状态持续时间并应用改进的 Viterbi算法时 ,虽然语音训练过程要慢一些 ,但其识别速度几乎是一样的 ,而且误识率有明显的降低。 Vaseghi′s consideration of state duration [3] is, in our opinion, not reasonable in one important respect, which is quite complicated. In section 2, we report how this one important respect should be changed to make it reasonable. We, like Vaseghi, use eq.(7) to calculate transition probability a ij (d i) . But concerning how to make use of a ij (d i) in considering state duration, we and Vaseghi hold different views. More importantly, Vaseghi considered the state duration for a certain state s i at a certain time to be a fixed value, but we consider that the speech vector can move along any of many possible paths, hence the state duration can have many different possible values. Our view requires eqs.(10) through (17) in section 2 to be reflected fully. In section 3, the training and recognition process using the improved Viterbi algorithm and K means clustering is introduced. Finally, experiments are carried out for 50 Chinese phones using standard and the improved Viterbi algorithm respectively. Results show that, with the improved algorithm, although training speed is slower, recognition speed is almost the same, and recognition error rate may be reduced greatly.

作者蒋冬梅傅国康赵荣椿

机构地区西北工业大学计算机科学与工程系

出处《西北工业大学学报》 EI CAS CSCD 北大核心 2000年第4期595-599,共5页 Journal of Northwestern Polytechnical University

关键词状态持续时间 HMM 非线性动态规划语音识别 VITERBI算法 K-MEANS聚类 state duration, Viterbi algorithm, speech recognitio0

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1姚天任.数字语音处理[M].武汉:华中理工大学出版社,1994.27-47. 被引量：7
2杨行峻,迟惠生等编著..语音信号数字处理[M].北京:电子工业出版社,1995:451.
3杨行峻，语音信号数字处理，1995年被引量：1
4姚天任，数字语音处理，1994年被引量：1
5Gu H，IEEE Trans Signal Processing，1991年，39卷，8期，1743页被引量：1

共引文献6

1丁昊,姚天任.基于mel标度频谱和音素分割的汉语语音单词端点检测方法[J].计算机与数字工程,2005,33(3):57-59. 被引量：3
2朱晓亮,杜旭,杨宗凯.一种基于高阶循环累积量的改进型VAD算法[J].电子与信息学报,2006,28(6):1021-1025.
3李玉龙,刘守印,罗建川,胡君红.基于TMS320C54X DSKplus的实时ADM语音编解码[J].电子技术应用,1999,25(4):66-67.
4朱荣,李红.主叫用户识别及其语音实现[J].武汉测绘科技大学学报,2000,25(3):268-272. 被引量：2
5刘声权,王芙蓉,黄本雄.G.723.1双速率语音编解码算法在TMS320VC5402上的实现[J].微电子技术,2002,30(2):37-41. 被引量：2
6徐耀华,王刚,郭英,门向生.一种基于噪声生成模型的语言消噪算法[J].空军工程大学学报（自然科学版）,2001,2(1):45-48. 被引量：3

同被引文献16

1冯刚,段其昌,张从力.一种多门限过零率前端检测理论的参数自优化方法研究[J].仪器仪表学报,2004,25(z3):525-527. 被引量：6
2张仁志,崔慧娟.基于短时能量的语音端点检测算法研究[J].电声技术,2005,29(7):52-54. 被引量：45
3陈方,高升.语音识别技术及发展[J].电信科学,1996,12(10):54-57. 被引量：26
4Seneff S. Real-time harmonic pitch detector [ J ]. IEEE Trans. on Acoustics, Speech and Signal Processing, 1978, 26(4) :358-365. 被引量：1
5Rodriguez percheron D, Faundez Zanuy M. Speaker recognition with a MLP classifier and LPCC codebook [ J ]. IEEE ICCASP, 1999,2 : 1005-1008. 被引量：1
6LEE K F. CONTEXT dependent phonetic hidden Markov models forspeaker-independent continuous speech recognition[ J]. IEEE Trans, 1990,38 (4) :599-609. 被引量：1
7Jeih Weih Hung. Optimization of filter-bank to improve the extraction of MFCC features in speech recognition [ J ]. IEEE ISIMP,2004,45 ( 8 ) :675-678. 被引量：1
8Ricotti L P. Multitapering and a wavelet variant of MFCC in speech recognition [ J ]. IP-VIS,2005,152 ( 1 ) :29-35. 被引量：1
9Skowronski M D, Harris J G. Increased MFCC filter band- width for noise-robust phoneme recognition [ J ]. ICASSP, 2002,1 ( 1 ) :801-804. 被引量：1
10姚天任,江太辉.数字信号处理[M].武汉:华中理工大学出版社,1998:190-195. 被引量：1

引证文献3

1张俊,危韧勇.基于连续HMM语音识别系统的构建与分析[J].计算机与现代化,2009(10):169-171.
2裴春宝.藏语数字语音识别仿真实验及测试方法分析[J].西藏大学学报（社会科学版）,2016,31(2):63-69. 被引量：1
3罗洋,周兰江.语音识别在旅游领域问句识别中的应用[J].软件导刊,2018,17(2):12-14.

二级引证文献1

1周挺,杨荣.多媒体网络语音音调数据特征智能识别方法[J].自动化与仪器仪表,2019(9):132-135. 被引量：1

1王可,王翠梅.语音识别中的归一化状态持续时间隐马尔可夫模型(英文)[J].四川大学学报（自然科学版）,1999,36(5):857-863.
2肖鸿博,吕幼新.混沌多时编码调相雷达波形设计[J].雷达科学与技术,2017,15(2):166-170. 被引量：1
3张晓东,吴捷.文本文件的语音识别中汉语音节的特征分析[J].巢湖学院学报,2004,6(3):76-83. 被引量：1
4廖希,薛睿,赵旦峰.一种适用于双卫星系统窄带LMS信道的状态模型[J].西安电子科技大学学报,2015,42(1):161-167. 被引量：2
5彭惠娴,崔展望.一种汉语音节型语音合成模型[J].电路与系统学报,1996,1(2):70-74.
6王颖,匡博,李爱军.改进的Viterbi多目标跟踪算法[J].计算机工程,2008,34(16):232-234.
7陈魁,冯寅.一种基于隐马尔可夫模型的第一类对位生成方法[J].福建电脑,2008,24(9):63-64.
8孟德香,吴湛击,梁红玉,吴伟陵.基于时变衰落信道分解的OFDM信号接收技术[J].电子与信息学报,2005,27(10):1630-1634.
9李锐,郑建宏.基带芯片中Viterbi译码器的研究与实现[J].微计算机信息,2007,23(32):92-93.
10廖希,薛睿,赵旦峰.一种适用于多场景的窄带LMS信道模型[J].哈尔滨工业大学学报,2015,47(3):66-71. 被引量：2

西北工业大学学报

2000年第4期

浏览历史

内容加载中请稍等...

考虑状态持续时间的改进Viterbi算法及语音识别被引量：3

参考文献5

共引文献6

同被引文献16

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

考虑状态持续时间的改进Viterbi算法及语音识别 被引量：3

参考文献5

共引文献6

同被引文献16

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

考虑状态持续时间的改进Viterbi算法及语音识别被引量：3