L_(1/2)稀疏约束卷积非负矩阵分解的单通道语音增强方法被引量：10

A single-channel speech enhancement approach using convolutive non-negative matrix factorization with L_(1/2) sparse constraint

下载PDF

导出

摘要为了刻画语音信号帧间相关性和使用更少的语音基表示语音特征,提出一种采用L_(1/2)稀疏约束的卷积非负矩阵分解方法进行单通道语音增强。首先,进行噪声学习得到噪声基;然后,以噪声基为先验信息结合L_(1/2)稀疏约束卷积非负矩阵分解方法学习含噪语音中的语音基成分;最后,利用学习到的语音基和系数重建出干净语音信号。在不同噪声环境下进行的实验结果表明,本文方法优于采用L_1稀疏约束的卷积非负矩阵方法及传统的统计语音增强方法。 A single-channel speech enhancement approach is presented, where a novel convolution non-negative matrix factorization algorithm with L1/2 sparse constraint is proposed, aiming at characterizing the inter-correlation of the speech signal and using less basis to present the speech signal. The noise basis is obtained firstly by training the noise, the speech basis is learnt from noisy speech by using the proposed approach combined with pre-trained noise basis. Then, the enhanced speech is reconstructed by the speech basis and its corresponding coefficients. Experimental results in different noise environments show that the proposed approach outperforms the convolution non-negative matrix factorization algorithm with L1 sparse constraint and conventional statistical speech enhancement algorithms.

作者路成田猛周健王华彬陶亮 LU Cheng TIAN Meng ZHOU Jian WANG Huabin TAO Liang(Key Laboratory of Intelligent Computing and Signal Processing of Ministry of Education, Anhui University Hefei 230031 Institute of Media Computing, Anhui University Hefei 230601)

机构地区安徽大学计算智能与信号处理教育部重点实验室安徽大学媒体计算研究所

出处《声学学报》 EI CSCD 北大核心 2017年第3期377-384,共8页 Acta Acustica

基金国家自然科学基金项目(61301295 61372137) 安徽大学博士科研启动经费项目安徽省自然科学基金项目(1708085MF151)资助

关键词语音增强非负矩阵分解含噪语音可懂度稀疏性正则化语音质量幅度谱无监督帧间 Convolution Matrix algebra Speech Speech communication Speech enhancement

分类号 TN912.35 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1孙健,张雄伟,曹铁勇,杨吉斌,孙新建.基于卷积非负矩阵分解的语音转换方法[J].数据采集与处理,2013,28(2):141-148. 被引量：12
2许春冬,夏日升,应冬文,李军锋.面向语音增强的序贯隐马尔可夫模型时频语音存在概率估计[J].声学学报,2014,39(5):647-654. 被引量：6
3HUANG Jianjun,ZHANG Xiongwei,ZHANG Yafei,ZOU Xia.Single channel speech enhancement via time-frequency dictionary learning[J].Chinese Journal of Acoustics,2013,32(1):90-102. 被引量：6
4杨琳,张建平,颜永红.单通道语音增强算法对汉语语音可懂度影响的研究[J].声学学报,2010,35(2):248-253. 被引量：17
5李轶南,张雄伟,贾冲,陈亮,曾理.稀疏低秩噪声模型下无监督实时单通道语音增强算法[J].声学学报,2015,40(4):607-614. 被引量：8
6XIAO Dong,MO Fuyuan,CHEN Geng,GUO Shengming,MA Li.Study of low bit rate speech codec algorithm in underwater acoustic communication[J].Chinese Journal of Acoustics,2013,32(4):411-424. 被引量：4

二级参考文献88

1双志伟,张世磊,秦勇.语音转换分析及相似度改进[J].清华大学学报（自然科学版）,2009(S1):1408-1412. 被引量：3
2王晶,傅丰林,张运伟.语音增强算法综述[J].声学与电子工程,2005(1):22-26. 被引量：20
3张家禄齐士钤宋美珍等.汉语声调在言语可懂度中的重要作用.声学学报,1981,7:237-237. 被引量：10
4Song Myung-Suk, Lee Chang-Heon, Kang Hong-Goo. Performance analysis of various single channel speech enhancement algorithms for automatic speech recognition. Inter- speech2006, 1451-1454, Pittsburgh, Pennsylvania. 被引量：1
5Hu Guoning, Wang DeLiang. Monaural speech segregation based on pitch tracking and amplitude modulation. IEEE Trans. Neural Networks, 2004; 15(5): 1135-1150. 被引量：1
6Hu Yi, Loizou P C. A comparative intelligibility study of single-microphone noise reduction algorithms. J. Acoust. Soc. Am., 2007; 122(3): 1777-1786. 被引量：1
7Hu Yi, Loizou P C. Subjective evaluation and comparison of speech enhancement algorithms. Speech Communication, 2007; 49:588-601. 被引量：1
8Kang Jian. Comparison of speech intelligibility between English and Chinese. J. Acoust. Soc. Am., 1998; 103(2): 1213-1216. 被引量：1
9Loizou P C. Speech enhancement: Theory and practice. CRC Press, 2007. 被引量：1
10Kong Y Y, Zeng F G. Temporal and spectral cues in Mandarin tone recogntion. J. Acoust. Soc. Am., 2006; 120(5): 2830-2840. 被引量：1

共引文献44

1梁瑞宇,邹采荣,赵力,王青云,奚吉.汉语数字助听器高频听损增强方法的实验研究[J].声学学报,2012,37(5):527-533. 被引量：1
2王辉,张玲华.数字助听器中广义旁瓣抵消器结构的汉语语音处理技术[J].声学学报,2012,37(5):534-538.
3蒋斌,匡正,吴鸣,杨军.汉语音段反转言语的可懂度研究[J].声学学报,2012,37(6):659-666. 被引量：3
4马振,张雄伟,杨吉斌.基于语音个人特征信息分离的语音转换方法研究[J].信号处理,2013,29(4):513-519. 被引量：3
5雍雅琴,沙洪,李鹏.数字助听器中广义旁瓣消除器的仿真研究[J].医疗卫生装备,2013,34(5):13-15. 被引量：1
6马振,张雄伟,杨吉斌,徐玉龙.基于稀疏卷积非负矩阵分解的语音转换方法研究[J].军事通信技术,2013,34(2):1-7.
7高新波,王笛,王秀美.一种潜在信息约束的非负矩阵分解方法[J].数据采集与处理,2014,29(1):11-18. 被引量：2
8姚绍芹,张玲华.基于GMM和ANN混合模型的语音转换方法[J].数据采集与处理,2014,29(2):227-231. 被引量：1
9张立伟,贾冲,张雄伟,闵刚,曾理.稀疏卷积非负矩阵分解的语音增强算法[J].数据采集与处理,2014,29(2):259-264. 被引量：13
10周健,郑文明,王青云,赵力.提高耳语音可懂度的非对称压缩语音增强方法[J].声学学报,2014,39(4):501-508. 被引量：3

同被引文献52

1张海,王尧,常象宇,徐宗本.L_(1/2)正则化[J].中国科学：信息科学,2010,40(3):412-422. 被引量：14
2黄德智,蔡莲红.一种面向声音变换的参数化模型[J].声学学报,2006,31(6):542-548. 被引量：2
3徐耀华,王刚,郭英.基于时频阈值的小波包语音增强算法[J].电子与信息学报,2008,30(6):1363-1366. 被引量：16
4李乐,章毓晋.基于双线性型的非负矩阵集分解[J].计算机学报,2009,32(8):1536-1549. 被引量：6
5龚亮,张艳萍.基于掩蔽效应的改进型自适应语音增强算法[J].南京信息工程大学学报（自然科学版）,2010,2(6):529-532. 被引量：6
6杨险峰,黄强.超光滑表面非接触测量方法研究[J].机械设计与制造,2011(2):211-212. 被引量：1
7张雪英,贾海蓉,靳晨升.子空间与维纳滤波相结合的语音增强方法[J].计算机工程与应用,2011,47(14):146-148. 被引量：6
8尹辉,谢湘,匡镜明.基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用[J].声学学报,2012,37(1):97-103. 被引量：14
9曹玉萍.基于信号子空间的语音增强方法[J].电子测试,2012,23(6):54-57. 被引量：3
10HUANG Jianjun,ZHANG Xiongwei,ZHANG Yafei,ZOU Xia.Single channel speech enhancement via time-frequency dictionary learning[J].Chinese Journal of Acoustics,2013,32(1):90-102. 被引量：6

引证文献10

1周健,刘荣敏,窦云峰,路成,陶亮.采用L1/2稀疏约束的梅尔倒谱系数语音重建方法[J].声学学报,2018,43(6):991-999. 被引量：5
2张星.改进NMF单通道语音增强算法[J].机械设计与制造,2019(1):268-271. 被引量：1
3张天骐,熊梅,张婷,杨强.结合区分性训练深度神经网络的歌声与伴奏分离方法[J].声学学报,2019,44(3):393-400. 被引量：1
4董兴磊,胡英,黄浩,吾守尔·斯拉木.基于卷积非负矩阵部分联合分解的强噪声单声道语音分离[J].自动化学报,2020,46(6):1200-1209. 被引量：3
5许春冬,徐琅,周滨,凌贤鹏.单通道语音增强技术的研究现状与发展趋势[J].江西理工大学学报,2020,41(5):55-64. 被引量：1
6葛宛营,张天骐,范聪聪,张天.噪声情况下采用稀疏非负矩阵分解与深度吸引子网络的人声分离算法[J].声学学报,2021,46(1):55-66. 被引量：4
7聂玲子,陈雪勤,赵鹤鸣.结合幅度谱和功率谱字典的语音增强方法[J].声学学报,2021,46(1):81-91. 被引量：5
8GE Wanying,ZHANG Tianqi,FAN Congcong,ZHANG Tian.Monaural noisy speech separation combining sparse non-negative matrix factorization and deep attractor network[J].Chinese Journal of Acoustics,2021,40(2):266-280.
9章雯,张君,王璐,赵静,鲍明,许耀华.稀疏正交联合约束多通道非负矩阵分解声信号分离算法[J].声学学报,2023,48(1):249-263. 被引量：2
10李艳生,刘园,张毅.基于感知掩蔽的重构非负矩阵分解单通道语音增强算法[J].计算机应用,2019,39(3):894-898. 被引量：7

二级引证文献28

1李艳生,刘园,张毅,杨美美.混响环境下移动机器人语音控制方法及系统实现[J].仪器仪表学报,2019,40(11):165-171. 被引量：13
2连海伦,周健,胡雨婷,郑文明.利用深度卷积神经网络将耳语转换为正常语音[J].声学学报,2020,45(1):137-144. 被引量：8
3曹丽静.语音增强技术研究综述[J].河北省科学院学报,2020,37(2):30-36. 被引量：7
4龙超,曾庆宁,罗瀛.基于噪声抵消与波束形成的小阵语音增强[J].计算机应用,2020,40(8):2386-2391. 被引量：5
5许晶晶.复杂噪声场景下的电子音乐信号智能检测算法设计[J].现代电子技术,2020,43(19):49-52. 被引量：1
6张开生,赵小芬.双重约束非负矩阵分解与改进正交匹配追踪算法的语音增强[J].河南科技大学学报（自然科学版）,2021,42(1):54-60. 被引量：4
7葛宛营,张天骐,范聪聪,张天.噪声情况下采用稀疏非负矩阵分解与深度吸引子网络的人声分离算法[J].声学学报,2021,46(1):55-66. 被引量：4
8熊松龄,曾庆宁,龙超,王师琦,祁潇潇,郑展恒.NMF的有监督算法在瞬变电磁信号降噪中的应用[J].石油物探,2021,60(3):421-429. 被引量：2
9GE Wanying,ZHANG Tianqi,FAN Congcong,ZHANG Tian.Monaural noisy speech separation combining sparse non-negative matrix factorization and deep attractor network[J].Chinese Journal of Acoustics,2021,40(2):266-280.
10马敏,刘一斐,刘亚楠.基于改进半阈值迭代算法的ECT图像重建[J].计量学报,2021,42(5):595-602. 被引量：5

1沈亚强,程仲文.一种基于自适应滤波的语音增强方法[J].信号处理,1993,9(1):9-14. 被引量：5
2马振,张雄伟,杨吉斌,徐玉龙.基于稀疏卷积非负矩阵分解的语音转换方法研究[J].军事通信技术,2013,34(2):1-7.
3葛勇,樊雯,刘慧龙.基于奇异谱分析的盲源分离单通道语音增强算法研究[J].军械工程学院学报,2014,26(1):51-54.
4秦大甲.有线电视系统的改良和重建转向光纤[J].文献快报（纤维光学与电线电缆）,1990(10):1-6.
5常卫国.为什么要重建网络基础设施?[J].通讯世界,2000(3):29-29.
6张雄伟,李轶南,时文华,胡永刚,陈栩杉.非负组合模型及其在声源分离中的应用[J].数据采集与处理,2017,32(2):266-277. 被引量：2
7陈渔源,陈永生,崔颖,郑志峻.语音半码率编码的一种实施方案[J].铁道学报,1998,20(2):71-74.
8徐培丽,王浩.有线电视用户终端常见故障分析[J].有线电视技术,2002,9(5):79-79.
9张梦阳,孙学斌,李斌,周正,张梦阳,孙学斌,李斌,周正.基于非负矩阵分解的频谱感知技术研究[J].无线电工程,2013,43(11):1-3. 被引量：2
10吴佳雯,刘沁婷,曾德炉,丁兴号,李琳.一种基于非参数贝叶斯理论的语音增强算法[J].厦门大学学报（自然科学版）,2017,56(3):423-428.

声学学报

2017年第3期

浏览历史

内容加载中请稍等...

L_(1/2)稀疏约束卷积非负矩阵分解的单通道语音增强方法被引量：10

参考文献6

二级参考文献88

共引文献44

同被引文献52

引证文献10

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

L_(1/2)稀疏约束卷积非负矩阵分解的单通道语音增强方法 被引量：10

参考文献6

二级参考文献88

共引文献44

同被引文献52

引证文献10

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

L_(1/2)稀疏约束卷积非负矩阵分解的单通道语音增强方法被引量：10