低信噪比环境下的语音识别方法研究被引量：11

Research on speech recognition in low SNR environment

下载PDF

导出

摘要单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。 The accuracy rate of single channel enhanced speech recognition in high SNR environment is acceptable, but not so in low SNR environment. In this case, speech enhancement based on logarithmic minimum mean square error（Log MMSE） algorithm and modified Wiener filter algorithm is presented. Firstly the gathered speech signals＇ SNR is improved by the Log MMSE algorithm. Then using the improved Wiener filter algorithm removes residual noise and improves the signal quality. Finally the enhanced speech is used for recognition by MFCC and HMM algorithms. Experimental results show that the proposed method can effectively remove the background noise and reduce the residual noise, significantly increase the accuracy of the automatic speech recognition in noisy environment.

作者王群曾庆宁谢先明郑展恒

机构地区桂林电子科技大学信息与通信学院

出处《声学技术》 CSCD 北大核心 2017年第1期50-56,共7页 Technical Acoustics

基金国家自然科学基金(61461011) 教育部重点实验室2016年主任基金(CRKL160107)资助项目

关键词语音增强低信噪比改进维纳滤波对数最小均方误差算法语音识别 speech enhancement low SNR modified Wiener filter Log MMSE algorithm speech recognition

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1张东方,蒋建中,张连海.一种改进型IMCRA非平稳噪声估计算法[J].计算机工程,2012,38(13):270-272. 被引量：6
2曹亮,张天骐,高洪兴,易琛.基于听觉掩蔽效应的多频带谱减语音增强方法[J].计算机工程与设计,2013,34(1):235-240. 被引量：9
3郭利华,马建芬.具有高可懂度的改进的维纳滤波的语音增强算法[J].计算机应用与软件,2014,31(11):155-157. 被引量：12
4胡丹,曾庆宁,龙超,黄桂敏.连续语音识别前端鲁棒性研究[J].电视技术,2015,39(24):43-46. 被引量：2
5宋知用编著..MATLAB在语音信号分析与合成中的应用[M].北京:北京航空航天大学出版社,2013:386.
6张亮,龚卫国.一种改进的维纳滤波语音增强算法[J].计算机工程与应用,2010,46(26):129-131. 被引量：19

二级参考文献46

1王莉,胡剑凌,徐盛.基于听觉掩蔽效应的语音增强算法的研究[J].电声技术,2006,30(7):39-42. 被引量：3
2Lim J S, Oppenheim A V.Enhancement and bandwidth compression of noisy speech[C]//Proceedings of the IEEE, 1979, 67: 1586-1604. 被引量：1
3Ephraim Y,Malah D.Speech enhancement using a minimum meansquare error log-spectral amplitude estimator[J].IEEE Trans on Acoustics,Speech,Signal Processing, 1985,ASSP-32:443-445. 被引量：1
4Ephraim Y, Malah D.Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator[J]. IEEE Trans on Acoustics, Speech, Signal Processing, 1984, AS- SP-32 : 1109-1121. 被引量：1
5Capp60.Elimination of the musical noise phenomenon with the Ephraim and Malah noise suppressor[J].IEEE Trans on Speech and Audio Processing, 1994,2 (2) : 345-349. 被引量：1
6Scalart P,Vieira-Filho J.Speech enhancement based on a priori signal to noise estimation[C]//Proc 21st IEEE Int Conf Acoust Speech Signal Processing, Atlanta, GA, 1996,2 (2) : 629-632. 被引量：1
7Cohen I.Speech enhancement using a noncausal a priori SNR estimator[J].IEEE Signal Processing Letters,2004(9):725-728. 被引量：1
8Arslan L M.Modified Wiener filtering[J].Signal Processing,2006, 86(2) :267-272. 被引量：1
9Xu Yao-hua, Guo Ying, Li Wei, et al.Elimination of musical noise phenomenon with Burg-based a priori SNR estimator[C]// Image and Signal Processing, 2008, CISP' 08,2008,5 : 328-332. 被引量：1
10阔永红,陈健,杨昌方.基于听觉掩蔽效应的MMSE语音增强算法[J].计算机工程与应用,2007,43(27):140-141. 被引量：5

共引文献40

1袁莉芬,刘辉,程俊.基于独立成分分析技术的语音除噪系统[J].湖南师范大学自然科学学报,2011,34(3):24-26. 被引量：2
2崔晓,张松炜.基于小波和先验信噪比维纳滤波的语音增强[J].河南师范大学学报（自然科学版）,2013,41(1):43-46. 被引量：2
3刘鹏,马建芬.具有较高可懂度的子空间语音增强算法[J].计算机工程与设计,2013,34(7):2619-2622. 被引量：4
4马多佳,刘孟美,王旸,栗小艳.超声检查报告语音录入系统[J].电子世界,2014(9):36-37. 被引量：4
5奚吉,梁瑞宇,王国伟,仇晓梅,马安骏.多通道助听器语音降噪算法研究[J].计算机工程与应用,2014,50(11):237-240. 被引量：2
6郭利华,马建芬.具有高可懂度的改进的维纳滤波的语音增强算法[J].计算机应用与软件,2014,31(11):155-157. 被引量：12
7徐昕,张天骐,石穗,张亚娟.结合语音增强的基音检测改进方法[J].计算机工程与设计,2015,36(3):699-704. 被引量：4
8张勇,刘轶.非平稳噪声环境下结合听觉掩蔽的语音增强[J].计算机工程与设计,2015,36(5):1279-1284. 被引量：3
9杨龙,陈建明.语音增强算法及进展[J].电声技术,2015,39(7):35-39. 被引量：5
10梁瑞宇,王国伟,薛万里,倪烨.面向助听器的语音信号处理算法开发平台设计[J].电子器件,2015,38(4):898-902.

同被引文献83

1李富强,万红,黄俊杰.基于MATLAB的语谱图显示与分析[J].微计算机信息,2005,21(10X):172-174. 被引量：27
2罗小桂,何雁.矩阵奇异值分解在计算技术中的应用[J].计算机与现代化,2006(6):67-68. 被引量：13
3江建民.产品通用设计辨析[J].装饰,2003(2):92-93. 被引量：10
4王淑珍,朱思泉.视觉和听觉的关系[J].国际耳鼻咽喉头颈外科杂志,2007,31(4):199-202. 被引量：8
5康春玉,章新华.一种基于奇异值分解的自适应降噪方法[J].声学技术,2008,27(3):455-458. 被引量：17
6徐靖涛,王金根.基于MATLAB的语音信号分析和处理[J].重庆科技学院学报（自然科学版）,2008,10(1):132-136. 被引量：17
7赵学智,叶邦彦,陈统坚.矩阵构造对奇异值分解信号处理效果的影响[J].华南理工大学学报（自然科学版）,2008,36(9):86-93. 被引量：52
8陈鸿雁.非视觉的深度感知——针对盲人的设计研究[J].美术学报,2008(4):62-66. 被引量：23
9于晓明,柏松.基于前向-后向HMM的连续语音识别系统的研究[J].计算机工程与设计,2009,30(18):4339-4341. 被引量：5
10王保华.通用设计原则与产品研发策略[J].中国康复理论与实践,2010,16(1):89-90. 被引量：4

引证文献11

1李盛,周斌,胡金艳,周鹏程,李涛,袁玉迪.奇异值分解在语音增强中的应用研究[J].徐州工程学院学报（自然科学版）,2017,32(3):53-56. 被引量：1
2黄春燕,景妮洁,祝红梅.语音信号的MATLAB分析与处理[J].计算机科学,2018,45(B06):555-558. 被引量：2
3李山.智能家具语音识别精准度优化仿真[J].计算机仿真,2018,35(11):281-284. 被引量：5
4樊海花,穆春阳,马行.基于多尺度熵和遗传算法改进的语音识别技术[J].现代电子技术,2019,42(6):126-131. 被引量：7
5史晓琴,王晓媛.云平台网络数字化信息自适应识别仿真[J].计算机仿真,2019,36(12):387-390. 被引量：2
6王若平,李仁仁,陈达亮,王东,房宇.基于改进小波包去噪与梅尔倒谱系数的低信噪比交通环境声音识别[J].科学技术与工程,2019,19(36):290-295. 被引量：14
7霍彦明,姜峰,冯怡林,李争.基于波束赋形技术与V290pub语音模块的新型降噪语音识别系统[J].现代电子技术,2020,43(10):46-50. 被引量：9
8张红兵.Mel频率下语音信号深度频谱特征提取方法仿真[J].计算机仿真,2020,37(5):197-200. 被引量：6
9张国峰,丁波.语音识别在语音增强中的应用[J].科技创新与应用,2022,12(36):178-180. 被引量：1
10徐佳欣.声音在视障人士出行App中的运用研究[J].工业设计研究,2018(1):202-206.

二级引证文献46

1李山.智能家居的现状和发展趋势研究[J].工业设计,2019,0(4):152-153. 被引量：8
2卓嘎,次仁尼玛.基于Matlab的藏语语音频谱仿真和分析[J].电子设计工程,2019,27(19):170-173. 被引量：2
3陈王盛.移动计算环境下统一身份认证的智慧化重构[J].赤峰学院学报（自然科学版）,2019,35(9):62-65.
4祝朝坤,魏伦胜.基于OPENCV手势识别的启蒙教育机器人的设计与实现[J].电子产品世界,2019,26(11):77-80. 被引量：2
5陈颖,汪功明,杨磊,辛礼兵.语音识别技术在智能家居的应用技术浅析[J].科学技术创新,2019(31):60-61. 被引量：7
6闵建亮,蔡铭.基于前额脑电多尺度小波对数能量熵的驾驶疲劳检测分析[J].中国公路学报,2020,33(6):182-189. 被引量：20
7陈代繁,游颖敏,朱翔鸥,王景芹.用于预测交流接触器电寿命的音频特征分析方法[J].温州大学学报（自然科学版）,2020,41(3):11-20.
8刘亚雷,顾晓辉,甘宁.一种新的四元阵列融合声源识别方法[J].科学技术与工程,2020,20(28):11620-11625. 被引量：3
9熊先青,李荣荣,白洪涛.中国智能家具产业现状与发展趋势[J].林业工程学报,2021,6(1):21-28. 被引量：59
10高渝蓉,娄屹萍.高密度电子电路多通道频谱误差自动识别研究[J].通信电源技术,2020,37(22):34-35.

1张万里,刘桥.Mel频率倒谱系数提取及其在声纹识别中的作用[J].贵州大学学报（自然科学版）,2005,22(2):207-210. 被引量：20
2李宏松,苏健民,黄英来,于慧伶.基于声音信号的特征提取方法的研究[J].信息技术,2006,30(1):91-94. 被引量：25
3李哲军,周萍,景新幸.基于改进噪声估计的谱减法应用于说话人识别[J].计算机测量与控制,2016,24(4):155-158.
4董治强,刘琚,邹欣,杜军.基于ICA的语音信号表征和特征提取方法[J].山东大学学报（工学版）,2010,40(4):19-22. 被引量：3
5舒若,李世宝,潘辛.SVAC音频编码的特征参数量化器改进[J].信息技术,2014,38(6):50-54.
6胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：19
7魏君颖,魏维.说话人识别特征提取算法改进[J].成都信息工程学院学报,2014,29(S1):67-70. 被引量：1
8潘海琦,杨震,徐珑婷,朱俊华.一种基于压缩感知的说话人识别参数分析[J].数据采集与处理,2015,30(2):399-407. 被引量：2
9陆伟,戴蓓蒨,李辉,刘青松.MFCC中的基音频率信息对说话人识别系统性能的影响[J].中国科学技术大学学报,2009,39(8):859-863. 被引量：11
10杨俊成,李淑霞.基于MFCC特征和隐马尔可夫模型的咳嗽信号自动识别[J].内蒙古师范大学学报（自然科学汉文版）,2016,45(6):799-801. 被引量：1

声学技术

2017年第1期

浏览历史

内容加载中请稍等...

低信噪比环境下的语音识别方法研究被引量：11

参考文献6

二级参考文献46

共引文献40

同被引文献83

引证文献11

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

低信噪比环境下的语音识别方法研究 被引量：11

参考文献6

二级参考文献46

共引文献40

同被引文献83

引证文献11

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

低信噪比环境下的语音识别方法研究被引量：11