基于隐马尔可夫模型的语音激活检测算法被引量：4

Voice activity detection algorithm based on hidden Markov model

下载PDF

导出

摘要针对现有基于隐马尔可夫模型(HMM)的语音激活检测(VAD)算法对噪声的跟踪性能不佳的问题,提出采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应噪声模型,建立噪声库的方法。在语音激活检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型;同时,为了适应语音信号的实时处理,降低了语音参数提取的复杂度,并对判决阈值提出改进,以保证语音信号帧间的相关性。在不同噪声环境下对改进算法进行性能测试并与自适应多速率编码(AMR)标准、国际电信联盟电信标准分局(ITU-T)的G.729B标准比较,测试结果表明,改进算法在实时语音信号处理中能够有效提高检测的准确率及噪声跟踪能力。 Concerning the problem that the existing Voice Activity Detection （VAD） algorithms based on Hidden Markov Model （HMM） were poor to track noise, a method using Baum-Welch algorithm was proposed to train the noise with different characteristics, and the corresponding noise model was generated to establish a library. When voice activity was detected, depending on the measured background noise of the speech, the voice was dynamically matched to a noise model in the library. Meanwhile, in order to meet real-time requirements of speech signal processing, reduce the complexity of the speech parameter extraction, the threshold was improved to ensure the inter-frame correlation of the speech signal. Under different noise environments, the improved algorithm performance was tested and compared with Adaptive Multi-Rate （ AMR）, G. 729B of the International Telecommunications Union （ITU-T）. The test results show that the improved algorithm can effectively improve the accuracy of detection and noise tracking ability in real-time voice signal processing.

作者李强陈浩陈丁当

机构地区信号与信息处理重庆市重点实验室(重庆邮电大学)

出处《计算机应用》 CSCD 北大核心 2016年第11期3212-3216,共5页 journal of Computer Applications

基金重庆市科委自然科学基金资助项目(cstc2015jcyjA40027)~~

关键词隐马尔可夫模型语音激活检测 Baum-Welch算法噪声库阈值 Hidden Markov Model （HMM） voice activity detection Baum-Welch algorithm noise library threshold

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献13

1KOLA J, ESPY-WILSON C, PRUTHI T. Voice activity detection[R/OL].[2016-01-20].http://www.ece.umd.edu/merit/archives/merit2011/merit_fair11_reports/report_Kola.pdf. 被引量：1
2OUKHERFELLAH M, BAHOURA M. FPGA implementation of voice activity detector for efficient speech enhancement[C]//Proceedings of the 2014 IEEE 12th International New Circuits and Systems Conference. Piscataway, NJ:IEEE, 2014:301-304. 被引量：1
3BERITELLI F, CASALE S, RUGGERI G, et al. Performance evaluation and comparison of G. 729/AMR/fuzzy voice activity detectors[J]. IEEE Signal Processing Letters, 2002, 9(3):85-88. 被引量：1
4张金榜,尹冬梅.基于统计模型的语音激活检测算法改进[J].微型机与应用,2015,34(12):14-16. 被引量：1
5SUH Y, KIM H. Multiple acoustic model-based discriminative likelihood ratio weighting for voice activity detection[J]. IEEE Signal Processing Letters, 2012, 19(8):507-510. 被引量：1
6ZHOU B, LIU J,PEI Z. Noise-robust voice activity detector based on four states-based HMM[J].Applied Mechanics and Materials, 2013, 411/412/413/414:743-748. 被引量：1
7RONAO C A, CHO S B. Human activity recognition using smartphone sensors with two-stage continuous hidden Markov models[C]//Proceedings of the 201410th International Conference on Natural Computation. Piscataway, NJ:IEEE, 2014:681-686. 被引量：1
8肖佳林,赵聿晴,王英.基于HMM与SVM的语音活动检测[J].计算机工程,2014,40(1):203-208. 被引量：10
9李嘉安娜..噪声环境下的语音端点检测方法研究[D].华南理工大学,2015:
10LI J A N. Research of voice activity detection method in noise environment[D]. Guangzhou:South China University of Technology, 2015:7-40). 被引量：1

二级参考文献6

1刘思伟,吕海波,慕德俊.基于G.729的自适应实时语音活动检测方法研究[J].计算机工程与应用,2007,43(34):57-60. 被引量：4
2SOHN J S, SUNG W Y. A voice activity detector employ- ing soft decision based noise spectrum adaptation[C]. Pro- ceeding of the IEEE Speech Coding Workshop, 1998:365- 368. 被引量：1
3CHO Y D, KONDOZ A. Analysis and improvement of a statisticalmodel-based voice activity detector[J]. IEEE Signal Processing Letters, 2001,8(10) :276-278. 被引量：1
4EPHRAIM Y, MALAH D. Speech enhancement using a minimummean-square error short-time spectral amplitude estimator[J]. IEEE Transactions on Acoust Speech and Sig- nal Processing, 1984,32(6) : 1109-1121. 被引量：1
5李宇,郭雷勇,谭洪舟.基于噪声倒谱阈值频谱估计的语音活动检测[J].计算机工程,2011,37(14):140-142. 被引量：3
6戴启军,卞正中,陈砚圃,张介秋.基于统计模型实现语音信号有声/无声检测的研究[J].西安交通大学学报,2002,36(8):839-842. 被引量：1

共引文献9

1袁松范.中国进入世贸组织的前景[J].中国医药情报,2000,6(1):34-37. 被引量：3
2叶瑰昀,宁珊,姜艳秋.卷积神经网络优化算法研究[J].齐齐哈尔大学学报（自然科学版）,2016,32(2):27-29.
3李坤,刘鹏,吕雅洁,张国鹏,黄宜华.基于Spark的LIBSVM参数优选并行化算法[J].南京大学学报（自然科学版）,2016,52(2):343-352. 被引量：21
4刘长征,张磊.语音识别中卷积神经网络优化算法[J].哈尔滨理工大学学报,2016,21(3):34-38. 被引量：20
5杨连群,孟魁,王斌,韩勇.基于隐马尔可夫模型的新型SQL注入攻击检测方法[J].信息网络安全,2017(9):115-118. 被引量：5
6崔建国,高波,蒋丽英,于明月,郑蔚.LSSVM与HMM在航空发动机状态预测中的应用研究[J].计算机工程,2017,43(10):310-315. 被引量：7
7刁彦华,郭月,王晓君.基于SVM的高分辨率遥感图像的分类方法研究[J].数学的实践与认识,2018,48(1):124-131. 被引量：6
8于国庆,郝若帆,马洪涛,吴赛敏,陈梦雅.基于图像处理和支持向量机的粉碎性秸秆覆盖率的图像识别方法研究[J].河南农业科学,2018,47(11):155-160. 被引量：8
9武鹏,郭晓芸,王海龙,陈鹏,王宗伟,汪莉.基于卷积神经网络模型的情绪识别技术在语音质检中的应用[J].电子设计工程,2021,29(5):164-168. 被引量：4

同被引文献36

1周楠,艾剑良.基于HMM和RNN的无人机语音控制方案与仿真研究[J].系统仿真学报,2020,32(3):464-471. 被引量：12
2肖英,叶强.低轨道卫星通信中越区切换信道分配算法研究[J].杭州电子科技大学学报（自然科学版）,2009,29(5):58-61. 被引量：1
3綦祥,刘成成,蔡云泽.具有马尔可夫通信过程的分布式估计器设计[J].控制工程,2013,20(S1):190-194. 被引量：1
4郭莉,殷南,王炳锡.语音业务中鲁棒性VAD算法分析[J].电声技术,2005,29(9):41-45. 被引量：9
5李锦,何培宇.一种改进的基于小波去噪HMM非特定人语音识别算法[J].四川大学学报（自然科学版）,2007,44(1):69-72. 被引量：12
6孟祥增.多媒体网络教学资源的内容特征提取与搜索研究[J].电化教育研究,2007,28(12):33-37. 被引量：14
7肖英,叶强,周浩淼.一种滞后控制的马尔可夫链计算方法[J].通信技术,2010,43(7):233-235. 被引量：2
8孔浩,杨勇,王国胤.基于多分类器融合的语音识别方法研究[J].重庆邮电大学学报（自然科学版）,2011,23(4):492-495. 被引量：7
9赵明明,王洪春.一种用于语音识别的高效分帧函数的研究[J].重庆工商大学学报（自然科学版）,2012,29(5):68-72. 被引量：4
10王凤春.吸收马尔可夫信源的信源信道联合编码策略[J].信息通信,2012,25(3):7-8. 被引量：1

引证文献4

1徐翠萍.基于隐马尔科夫模型的网球音频语义分析[J].信息技术,2019,43(8):103-106.
2张濛.马尔可夫过程在通信物理层中的智能化应用[J].舰船电子工程,2021,41(12):64-67.
3黄清,方木云.一种基于HMM算法改进的语音识别系统[J].重庆工商大学学报（自然科学版）,2022,39(5):56-61. 被引量：11
4尹文昊,李晓松,齐彦西,任泓宇.语音激活检测方法的分析和比较[J].信息记录材料,2023,24(4):240-242.

二级引证文献11

1涂琼引,成南.基于语音识别的英语翻译终端设计[J].自动化与仪器仪表,2023(1):251-256.
2李丹.基于SpeechBrain的语音识别在语音问答中的应用探索[J].科技视界,2023(2):34-39. 被引量：1
3刘邦桂.基于人工智能的网络空间安全防御策略研究[J].软件工程,2023,26(4):52-56. 被引量：3
4王蕊.基于BP神经网络的机器翻译自动化评判模型设计[J].自动化与仪器仪表,2023(4):15-19.
5王雨佳.基于语音合成的机器翻译机器人设计[J].自动化与仪器仪表,2023(4):185-190. 被引量：1
6王泽雨,王国靖.基于改进卷积神经网络的声音事件分类模型[J].信息技术与信息化,2023(5):181-184. 被引量：1
7韩向阳.基于卷积神经网络的中文语音识别人机交互系统设计[J].自动化与仪器仪表,2023(7):201-204.
8杨雪霁.面向多人语音识别的对话系统研究[J].自动化与仪器仪表,2023(8):286-290. 被引量：2
9赵亚文,范剑红,陈金国,涂志松,曹存岚,张玉龙.基于GMM训练与HMM变换的波纹管振动信号分析[J].四川轻化工大学学报（自然科学版）,2023,36(5):33-40.
10陈成,耿晓中,刘柏进,汪林恩,户唯新.一种改进的SwinTransformer图像分类识别方法[J].软件工程,2024,27(1):19-22. 被引量：1

1Cirrus Logic最新智能音频编解码提供先进音频特性[J].单片机与嵌入式系统应用,2017,17(1):88-88.
2刘福星,何选森.三阶累积量的语音激活检测方法[J].计算机工程与应用,2011,47(17):137-139. 被引量：2
3李志鹏,陈善广,薛亮.解决Baum-Welch算法下溢问题的参数重估公式中存在的问题及其更正[J].声学学报,2001,26(5):468-475. 被引量：1
4孙江胜,高振斌,韩月秋.第三代移动通信系统自适应多速率编码技术研究[J].河北工业大学学报,2005,34(3):34-38. 被引量：2
5邢文龙,张伯虎.HMM语音识别系统中Baum-Welch算法的优化[J].江苏科技信息,2013(19):58-59.
6王国刚,朱秀昌.与观测信息相关的n阶隐马尔可夫模型的参数估计[J].南京邮电大学学报（自然科学版）,2013,33(6):48-53. 被引量：1
7刘亮.自适应多速率编码简介[J].现代通信,2004(5):16-17.
8贾宾,朱小燕,罗予频,tsinghua.edu.cn,胡东成.消除溢出问题的精确Baum-Welch算法[J].软件学报,2000,11(5):707-710. 被引量：7
9梁峰,杨勇,曹军勤,张凡.一种新型实用的语音激活检测方法[J].计算机与网络,2012,38(19):59-61.
10齐峰岩,鲍长春.一种具有鲁棒性的语音激活检测方法[J].信号处理,2005,21(z1):172-175.

计算机应用

2016年第11期

浏览历史

内容加载中请稍等...

基于隐马尔可夫模型的语音激活检测算法被引量：4

参考文献13

二级参考文献6

共引文献9

同被引文献36

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于隐马尔可夫模型的语音激活检测算法 被引量：4

参考文献13

二级参考文献6

共引文献9

同被引文献36

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于隐马尔可夫模型的语音激活检测算法被引量：4