基于生成对抗网络联合训练的语音分离方法被引量：3

Speech Separation Method Based on Cooperative Training of Generative Adversarial Network

下载PDF

导出

摘要基于深度神经网络的语音分离方法大都在频域上进行训练,并且在训练过程中往往只关注目标语音特征,不考虑干扰语音特征。为此,提出了一种基于生成对抗网络联合训练的语音分离方法。该方法以时域波形作为网络输入,保留了信号时延导致的相位信息。同时,利用对抗机制,使生成模型和判别模型分别训练目标语音和干扰语音的特征,提高了语音分离的有效性。实验中,采用Aishell数据集进行对比测试。结果表明,本文所提方法在三种信噪比条件下都有良好的分离效果,能更好地恢复出目标语音中的高频频段信息。 Most speech separation methods based on deep neural networks are trained in frequency domain,and in the process of training,they usually only focus on the features of target speech,without considering the features of interference speech.For this reason,a speech separation method based on cooperative training of generative adversarial network is proposed.This method takes the time-domain waveform as the network’s input and retains the phase information caused by the signal delay.At the same time,the generative model and discriminative model are used to train the features of the target speech and the interference speech respectively,which improves the effectiveness of speech separation.In the experiment,a comparative test is performed on the Aishell data set.The results show that the proposed method has a good separation effect under three SNR conditions,and can better recover the high frequency band information of the target speech.

作者王涛全海燕 Wang Tao;Quan Haiyan(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming,Yunnan 650500,China)

机构地区昆明理工大学信息工程与自动化学院

出处《信号处理》 CSCD 北大核心 2020年第6期1013-1019,共7页 Journal of Signal Processing

基金国家自然科学基金(41364002)。

关键词语音分离时域波形生成对抗网络联合训练 speech separation time-domain waveform generative adversarial network cooperative training

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1王怡斐,韩俊刚,樊良辉.基于WGAN的语音增强算法研究[J].重庆邮电大学学报（自然科学版）,2019,31(1):136-142. 被引量：11
2LI Xu,TU Ming,WANG Xiaofei,WU Chao,FU Qiang,YAN Yonghong.Single-Channel Speech Separation Based on Non-negative Matrix Factorization and Factorial Conditional Random Field[J].Chinese Journal of Electronics,2018,27(5):1063-1070. 被引量：1
3时文华,张雄伟,邹霞,孙蒙.利用深度全卷积编解码网络的单通道语音增强[J].信号处理,2019,35(4):631-640. 被引量：5
4范存航,刘斌,陶建华,温正棋,易江燕.一种基于卷积神经网络的端到端语音分离方法[J].信号处理,2019,35(4):542-548. 被引量：13

二级参考文献6

1李轶南,张雄伟,曾理,黄建军.改进的稀疏字典学习单通道语音增强算法[J].信号处理,2014,30(1):44-50. 被引量：12
2胡永刚,张雄伟,邹霞,闵刚,郑云飞,李莉,石佳佳.改进的非负矩阵分解语音增强算法[J].信号处理,2015,31(9):1117-1123. 被引量：7
3刘斌,陶建华.联合长短时记忆递归神经网络和非负矩阵分解的语音混响消除方法[J].信号处理,2017,33(3):268-272. 被引量：11
4王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃.生成式对抗网络GAN的研究进展与展望[J].自动化学报,2017,43(3):321-332. 被引量：327
5李策,赵新宇,肖利梅,杜少毅.生成对抗映射网络下的图像多层感知去雾算法[J].计算机辅助设计与图形学学报,2017,29(10):1835-1843. 被引量：12
6时文华,倪永婧,张雄伟,邹霞,孙蒙,闵刚.联合稀疏非负矩阵分解和神经网络的语音增强[J].计算机研究与发展,2018,55(11):2430-2438. 被引量：9

共引文献24

1黄鐄,陶海军,王海峰.条件生成对抗网络的低照度图像增强方法[J].中国图象图形学报,2019,24(12):2149-2158. 被引量：15
2高登峰,杨波,刘洪,杨红雨.多特征全卷积网络的地空通话语音增强方法[J].四川大学学报（自然科学版）,2020,57(2):289-296. 被引量：7
3王骞,何培宇,徐自励.利用奇异谱分析的深度神经网络语音增强方法[J].信号处理,2020,36(6):902-910. 被引量：4
4陈修凯,陆志华,周宇.基于卷积编解码器和门控循环单元的语音分离算法[J].计算机应用,2020,40(7):2137-2141. 被引量：7
5王丽君,史二娜.基于卷积神经网络的智能交通信号控制研究[J].信息技术,2020,44(10):56-60. 被引量：3
6韩灿灿,李志华,徐睿.基于CycleGAN的非平行语音去噪方法[J].计算机与现代化,2021(2):73-77.
7杨明亮,龙华,邵玉斌,杜庆治.基于i-vector全局参数联合的说话人识别[J].重庆邮电大学学报（自然科学版）,2021,33(1):144-151. 被引量：1
8王涛,全海燕.低信噪比下联合训练生成对抗网络的语音分离[J].计算机工程与科学,2021,43(6):1088-1094.
9刘继展,侯广宇.语音技术在农业智能化中的应用展望[J].江苏大学学报（自然科学版）,2021,42(5):540-545. 被引量：2
10徐桂敏,杨正祥.基于稀疏傅里叶变换的电子通信网络弱信号捕获系统[J].现代电子技术,2021,44(19):19-23. 被引量：3

同被引文献8

1杨俊美,余华,韦岗.独立分量分析及其在信号处理中的应用[J].华南理工大学学报（自然科学版）,2012,40(11):1-12. 被引量：22
2刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：70
3胡涛,张超,程炳,吴小培.卷积神经网络在异常声音识别中的研究[J].信号处理,2018,34(3):357-367. 被引量：19
4林向伟,曾焕强,侯进辉,朱建清,蔡灿辉.基于多细节卷积神经网络的单幅图像去雨方法[J].信号处理,2019,35(3):460-465. 被引量：8
5范存航,刘斌,陶建华,温正棋,易江燕.一种基于卷积神经网络的端到端语音分离方法[J].信号处理,2019,35(4):542-548. 被引量：13
6孙林慧,吴子皓,谢可丽,李平安.基于双层字典学习的单通道语音增强方法[J].信号处理,2020,36(6):1001-1012. 被引量：3
7王志杰,张学良.基于双路径循环神经网络的单通道语音增强[J].信号处理,2021,37(10):1872-1879. 被引量：8
8谢福仕,康迂勇,施明月,郑能恒.基于多目标联合优化的语音增强方法研究[J].信号处理,2021,37(10):1996-2003. 被引量：2

引证文献3

1王大东,胡希颖,王晓宇.基于U-NET3D的机器人歌声分离[J].吉林师范大学学报（自然科学版）,2021,42(1):111-116. 被引量：2
2曾焕强,胡浩麟,林向伟,侯军辉,蔡灿辉.深度神经网络压缩与加速综述[J].信号处理,2022,38(1):183-194. 被引量：14
3孙林慧,张蒙,梁文清.基于CNN-SVM性别组合分类的单通道语音分离[J].信号处理,2022,38(12):2519-2531. 被引量：1

二级引证文献17

1英昌盛,李紫薇,尹继一,孙浩然,李享.一种基于格雷码与one-hot混合编码思想的组合数生成算法[J].吉林师范大学学报（自然科学版）,2021,42(3):105-109. 被引量：2
2王骞,陶青川.基于AI神经网络加速芯片的模型量化算法[J].现代计算机,2021,27(36):28-33. 被引量：2
3李奕铎,郭子博,刘凯,孙逍遥.基于误差限制的神经网络混合精度量化方法(特邀)[J].红外与激光工程,2022,51(4):134-141.
4李志刚,孙晨伟,魏彪,孙晓川.空天地海一体化海洋环境数据多步预测[J].信号处理,2022,38(8):1620-1631. 被引量：1
5王迪,李赵松,黄倩,王琼华.计算全息图的快速生成技术[J].信号处理,2022,38(9):1863-1871.
6李扬,许魁,张冬梅,徐健卉,谢威,夏晓晨,李娜.基于深度学习的多模OFDM索引调制检测器[J].信号处理,2022,38(12):2553-2562. 被引量：2
7程小辉,李钰,康燕萍.基于中间图特征提取的卷积网络双标准剪枝[J].计算机工程,2023,49(3):105-112. 被引量：1
8陈立玮,周新志.基于特征自注意力的图像分类知识蒸馏算法[J].现代计算机,2023,29(4):49-53. 被引量：3
9黄一凡,张欣,支天,张蕊,张曦珊,周学海.基于多段插值拟合的深度神经网络非线性层加速方法[J].高技术通讯,2023,33(3):280-291. 被引量：1
10陈东,刘宁.深度学习中的模型压缩技术[J].人工智能,2023(3):40-51.

1栾书明,程龙彪,孙兴伟,李军锋,颜永红.基于深度学习的两阶段联合声学回波和混响抑制技术[J].信号处理,2020,36(6):948-957. 被引量：1
2王冬霞,张伟,于玲,刘孟美.基于BLSTM神经网络的回声和噪声抑制算法[J].信号处理,2020,36(6):991-1000. 被引量：7
3张钧,姜思仪,彭喜元.基于欠采样的载频与二维到达角联合估计方法[J].电子测量与仪器学报,2020,32(4):142-149. 被引量：2
4汪进锋,刘子威,金杨,杨翠茹,邬彪彪,田思雷,钟玉廷.架空配电线路感应过电压计算方法适用性研究[J].电瓷避雷器,2020(3):86-91. 被引量：5

信号处理

2020年第6期

浏览历史

内容加载中请稍等...

基于生成对抗网络联合训练的语音分离方法被引量：3

参考文献4

二级参考文献6

共引文献24

同被引文献8

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于生成对抗网络联合训练的语音分离方法 被引量：3

参考文献4

二级参考文献6

共引文献24

同被引文献8

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于生成对抗网络联合训练的语音分离方法被引量：3