摘要
为了进一步提高语音增强算法的性能,针对传统的WebRTC语音增强算法和基于LSTM的语音增强算法语音增强效果不理想的问题,提出了一种基于全卷积神经网络的语音增强算法。其采用两层全卷积层构成编码器提取含噪语音深层次特征,然后通过对称的解码器网络进行解码,最后通过一个全连接层输出纯净语音的特征。通过全卷积神经网络可以更好地利用含噪语音的上下文信号,提取出语音更抽象更深层次的特征。通过与WebRTC和LSTM算法进行对比,在低信噪比情况下,该算法的STOI(短时客观可理解度)和PESQ(语音质量感性评估)有较大提高。实现结果表明,其方法能够有效地提高在未知噪声情况下的语音增强性能,增强后的语音具有更好的语音质量与可懂度。
出处
《计算机应用研究》
CSCD
北大核心
2020年第S01期135-137,共3页
Application Research of Computers