联合噪声分类和掩码估计的语音增强方法被引量：3

Joint noise classification and mask estimation for speech enhancement

下载PDF

导出

摘要为了克服传统语音增强算法对语音信号和噪声信号各种假设前提的依赖,并且提升语音增强性能,本文在基于深层神经网络的语音增强方法的基础上,提出了一种联合噪声分类和卷积神经网络的时频掩码估计方法。该算法综合考虑到多种类型噪声混合的带噪信号会对训练的卷积神经网络的预测精度产生不同程度的影响,其通过噪声分类识别,自适应被各类噪声污染的语音信号的时频掩码的估计,并利用语音活性检测方法对预测的掩码进行后修正。实验结果表明,该算法在多种噪声环境下取得更大的信噪比增益。 To avoid making unreasonable assumptions for speech and noise signals in traditional speech enhancement methods and promote the performance of speech enhancement,this paper proposed the algorithm joint noise classification and convolutional neural networks(CNN)for speech enhancement,based on deep neural networks(DNN)methods.The proposed algorithm takes information of the fact that unclassified noise will decrease accuracy of the prediction model in training phase and makes specific training for each type noisy speech signal by noise classification.And it adds post-refinement using voice activity detection(VAD).Experimental results show that the proposed algorithm makes a greater promotion on signal to noise ratio(SNR)

作者凌佳佳袁晓兵 LING Jia-jia;YUAN Xiao-bing(Science and Technology on Microsystem Laboratory,Shanghai Institute of Microsystem and Information Technology,Chinese Academy of Sciences,Shanghai 200050,China;School of Information Science and Technology,ShanghaiTech University,Shanghai 201210,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院上海微系统与信息技术研究所微系统技术重点实验室上海科技大学信息科学与技术学院中国科学院大学

出处《电子设计工程》 2018年第17期30-34,共5页 Electronic Design Engineering

关键词语音增强时频掩码卷积神经网络噪声分类 speech enhancement time-frequency mask convolutional neural networks noise classification

分类号 TN912.35 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献7

1徐勇..基于深层神经网络的语音增强方法研究[D].中国科学技术大学,2015:
2刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：68
3王水平,唐振民,陈北京,蒋晔.复杂环境下语音增强的复平面谱减法[J].南京理工大学学报,2013,37(6):857-862. 被引量：6
4郭利华,马建芬.具有高可懂度的改进的维纳滤波的语音增强算法[J].计算机应用与软件,2014,31(11):155-157. 被引量：12
5袁文浩..基于噪声估计的语音增强方法研究[D].华东理工大学,2013:
6李航著..统计学习方法[M].北京:清华大学出版社,2012:235.
7周志华著..机器学习[M].北京:清华大学出版社,2016:425.

二级参考文献91

1Loizou P. Speech Enhancement: Theory and Practice [ M ]. Boca Ra- ton : Florida: CRC Press LLC ,2007. 被引量：1
2Hu Y, Loizou P. A comparative intelligibility study of single-micro- phone noise reduction algorithms [ J ]. J. Acoust. Soc. Am, 2007,22 (3) :1777 - 1786. 被引量：1
3Ephraim Y, Malah D. Speech enhancement using a minimum mean- square error short-time spectral amplitude estimator[ J]. IEEE Trans. Acoust, Speech, Signal Processing, 1984,32 (6) : 1109 - 1121. 被引量：1
4Chen F, Loizou P. Impact of SNR and gain-function over- and under- estimation on speech intelligibility [ J ]. Speech Communication,2012, 54:272 - 281. 被引量：1
5Whitehead P, Anderson D. Robust Bayesian analysis applied to Wie- ner filtering of speech [ C ]//Proc. 36th IEEE Int. Conf. Acoust. Speech Signal Process, Prague ,2011:5080 - 5083. 被引量：1
6Loizou P, Kim G. Reasons why current speech-enhancement algo- rithms do not improve speech intelligibility and suggested solutions [J]. IEEE Trans. Audio, Speech, Lang. Process, 2011,19 ( 1 ) : 47 -56. 被引量：1
7Sealart P, Vieira-Filho V. Speech enhancement based on a priori sig- nal to noise estimation [-C ]//Proc. 21st IEEE Int. Conf. Acoust. Speeeh Signal Processing, Atlanta,1996:629 - 632. 被引量：1
8Alam M J, O'Shaughnessy D. Perceptual improvement of Wiener filte- ring employing a post-filter[J], Digital Signal Processing,2011,21:54 - 65. 被引量：1
9IEEE Subcommittee. IEEE Recommended Practice for Speech Quality Measurements[J]. IEEE Trans. Audio and Electroacoustics, 1969,17 (3) :225 -246. 被引量：1
10Ma J, Hu Y, Loizou P. Objective measures for predicting speech intel- ligibility in noisy conditions based on new band-importance functions [ J ]. J. Acoust. Soc. Am,2009,125 ( 5 ) : 3387 - 3405. 被引量：1

共引文献83

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：13
2杨海龙,曾祥福,钟维良.多尺度时域单通道语音分离网络设计[J].电声技术,2021,45(10):96-99.
3黄张翼,周翊,舒晓峰,刘宏清.联合贝叶斯估计与深度神经网络的语音增强方法[J].小型微型计算机系统,2019,40(1):40-44. 被引量：5
4蔡萍.非高斯零均值噪声环境下的语音增强算法[J].湖南理工学院学报（自然科学版）,2015,28(1):26-28.
5张正文,周航麒.基于多窗谱估计的维纳滤波语音增强算法[J].河南理工大学学报（自然科学版）,2015,34(5):686-690. 被引量：6
6董晓峰,顾晓文,王业,朱国防.电网倒闸操作票智能监护系统设计[J].中国电力,2015,48(12):16-22. 被引量：12
7孙成立,穆俊生.基于特征值置换的子空间语音增强算法[J].计算机工程,2016,42(2):272-277. 被引量：1
8叶琪,陶亮,周健,王华彬.基于联合失真控制的子空间语音增强算法[J].声学技术,2016,35(3):254-259.
9孟欣,马建芬,张雪英.一种低信噪比条件下的高可懂度的语音增强算法[J].计算机应用与软件,2016,33(10):145-147. 被引量：3
10张青,吴进.基于多窗谱估计的改进维纳滤波语音增强[J].计算机应用与软件,2017,34(3):67-70. 被引量：11

同被引文献19

1周晓凤,肖南峰,文翰.基于情感特征分类的语音情感识别研究[J].计算机应用研究,2012,29(10):3648-3650. 被引量：5
2袁文浩,林家骏,王雨,陈宁.一种基于噪声分类的语音增强方法[J].华东理工大学学报（自然科学版）,2014,40(2):196-201. 被引量：5
3严新华.基于压缩感知算法的目标跟踪系统设计[J].自动化与仪器仪表,2018,0(12):136-138. 被引量：5
4韩伟,张雄伟,周星宇,白崧廷,闵刚.联合优化深度神经网络和约束维纳滤波的单通道语音增强方法[J].计算机应用研究,2017,34(3):706-709. 被引量：6
5韩伟,张雄伟,闵刚,张启业.基于感知掩蔽深度神经网络的单通道语音增强方法[J].自动化学报,2017,43(2):248-258. 被引量：18
6孟欣,马建芬,张雪英.改进的参数自适应的维纳滤波语音增强算法[J].计算机工程与设计,2017,38(3):714-718. 被引量：8
7刘兴旺,王江晴,徐科.一种融合AutoEncoder与CNN的混合算法用于图像特征提取[J].计算机应用研究,2017,34(12):3839-3843. 被引量：19
8吴进,赵隽,李乔深.基于维纳过滤的IMCRA算法[J].西安邮电大学学报,2017,22(5):73-77. 被引量：2
9王玉娇,刘昱,陈林海,杨连军.一种改进的基于压缩感知的心电压缩算法[J].计算机测量与控制,2018,26(7):266-270. 被引量：2
10袁文浩,娄迎曦,梁春燕,王志强.感知联合优化的深度神经网络语音增强方法[J].西安电子科技大学学报,2019,46(2):89-94. 被引量：4

引证文献3

1朱晓铭,王仲悦,陈林海,张帅,王云峰.基于卷积自编码器的心电压缩方法[J].电子设计工程,2019,27(22):65-69. 被引量：1
2张行,赵馨.基于神经网络噪声分类的语音增强算法[J].中国电子科学研究院学报,2020,15(9):880-885. 被引量：4
3郑莉,李鸿燕.时频掩码优化的两阶段语音增强算法[J].电子设计工程,2022,30(4):17-21. 被引量：1

二级引证文献6

1孙立辉,曹丽静,张竟雄.基于升降编解码全卷积神经网络语音增强技术[J].智能计算机与应用,2021,11(2):19-22.
2徐浩森,姜囡,齐志坤.基于注意力机制的卷积循环网络语音降噪[J].科学技术与工程,2022,22(5):1950-1957. 被引量：9
3张逸,周莉,陈杰.基于知识蒸馏的心律失常分类模型[J].电子设计工程,2022,30(8):21-25. 被引量：1
4徐浩森,姜囡,齐志坤.噪声分析在语音检验中的应用研究[J].警察技术,2022(4):51-56. 被引量：1
5陈琳.面向语音特征提取的英语机器人识别方法构建[J].自动化与仪器仪表,2022(8):234-239.
6张洁.基于MEC的移动通信网络传输信号增强方法[J].电子设计工程,2023,31(17):169-172. 被引量：1

1徐娜,吴长奇.结合差分阵列与幅度谱减的双麦语音增强算法[J].信号处理,2018,34(7):876-881. 被引量：7
2郭一豪.基于LMS算法滤波的语音降噪研究[J].电子制作,2018,26(13):56-58. 被引量：3
3荣毅.城市道路噪声环境影响及污染防治对策研究[J].现代盐化工,2018,45(3):82-83. 被引量：1
4祝丽娟,金婷婷,陈文安.氯诺昔康体外孵育体系的建立及氯诺昔康代谢产物5-OH氯诺昔康的检测[J].中国药师,2018,21(7):1177-1180.
5胡岸,高勇.基于变窗长搜索的改进型噪声估计算法[J].计算机系统应用,2018,27(9):124-129. 被引量：3
6刘宁,张柏林,窦全丽,王双双.蓖麻毒素结构及其活性检测方法研究进展[J].安徽农业科学,2018,46(18):33-35. 被引量：3
7谢骁祥,江高峰,杜柳涛.无义突变通读活性检测方法的研究进展[J].中国药理学与毒理学杂志,2016,30(10):1087-1088.
8郭苗苗,齐志光,王磊,徐桂芝.语言脑机接口康复系统中的参数优化研究[J].信号处理,2018,34(8):974-983. 被引量：7
9高全新,刘云霞,程玉强,严亚贤,孙建和.鸭IFN-β启动子双荧光素酶报告基因系统的构建及活性检测[J].上海农业学报,2018,34(3):66-71. 被引量：1
10董建萍,郎振晶,公维民,董国强,闫庆学.基于地震振幅谱分维数的油气预测软件系统研制[J].国外测井技术,2018,39(3):76-78.

电子设计工程

2018年第17期

浏览历史

内容加载中请稍等...

联合噪声分类和掩码估计的语音增强方法被引量：3

参考文献7

二级参考文献91

共引文献83

同被引文献19

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

联合噪声分类和掩码估计的语音增强方法 被引量：3

参考文献7

二级参考文献91

共引文献83

同被引文献19

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

联合噪声分类和掩码估计的语音增强方法被引量：3