基于GCC-NMF的语音分离研究被引量：1

Study of speech separation based on Non-Negative Matrix Factorization combined with Generalized Cross-Correlation algorithm

下载PDF

导出

摘要为了使盲源分离算法能更好地应用于一些实际噪声和训练数据较少且不需要做标记的环境,文章提出了一种无监督的非负矩阵字典学习方法。该方法对混合信号进行字典学习,随后在每个时间点上根据其空间源对字典原子进行分组来实现分离。通过从SiSEC获取语音和现实噪声的两通道混合信号作为数据集,使用PEASS和BSS Eval工具包分别基于感知、基于SNR和PEMO-Q的度量来量化性能。此外,还评估模型了参数对分离质量的影响,并将该方法与其他无监督和半监督的语音分离方法进行比较。结果证明,GCC-NMF是一种灵活的源分离算法,在3种评估参数中的每个参数均胜过特定任务的方法,包括盲源以及需要先验知识或信息的多种已知方法。 An unsupervised non-negative matrix dictionary learning method is proposed to make the blind source separation algorithm better applicable under the circumstances with actual noise and less training data which don′t need to be marked.Dictionary learning is performed on the mixture signal and separated by grouping dictionary atoms according to their spatial origins.By acquiring a two-channel mixed signal of speech and real noise from SiSEC as a data set,the PEASS and BSS Eval toolkits are used to quantify performance using perceptual-based,SNR-based,and PEMO-Q metrics,respectively.Besides,the effect of separation quality via model parameters is also evaluated and compared with other unsupervised and semi-supervised separation methods.The results prove that GCC-NMF is a flexible algorithm for origins separation,as each parameter is superior to that from other specific target approaches,including blind separation speech and other existed approaches that require priori knowledge and information.

作者吴君钦王迎福 WU Junqin;WANG Yingfu(School of Information Engineering,Jiangxi University of Science and Technology,Ganzhou 341000,Jiangxi,China)

机构地区江西理工大学信息工程学院

出处《江西理工大学学报》 CAS 2020年第5期65-72,共8页 Journal of Jiangxi University of Science and Technology

基金国家自然科学基金资助项目(61741109)。

关键词盲源分离非负矩阵分解听觉场景分析广义互相关字典学习 blind source separation NMF CASA GCC dictionary learning

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1郭海燕,杨震,朱卫平.一种新的基于稀疏分解的单通道混合语音分离方法[J].电子学报,2012,40(4):762-768. 被引量：5
2杨海滨,张军.基于模型的单通道语音分离综述[J].计算机应用研究,2010,27(11):4025-4031. 被引量：4
3赵晶..非负稀疏信号分解及在单声道声音分离中的应用[D].电子科技大学,2006:
4任克强,李辉环,谢斌.基于DWT的双重数字音频盲水印算法[J].江西理工大学学报,2011,32(3):1-5. 被引量：1

二级参考文献68

1冯涛,韩纪庆.基于听觉特性的音频水印能量估计及自适应嵌入算法研究[J].声学学报,2006,31(1):48-54. 被引量：13
2CHERRY E C. Some experiments on the recognition of speech, with one and with two ears [ J ]. Journal of the Acoustical Society of America, 1953,25 ( 5 ) : 975- 979. 被引量：1
3CICHOCKI A,PARK H M,LEE S Y. Blind source separation and independent component analysis: a review [ J ]. Neural Information Processing-Letters and Reviews ,2005,6( 1 ) : 1-57. 被引量：1
4BELL A J, SEJNOWSK! T J. An information maximization approach to blind separation and blind deconvolution[ J]. Neural Computation, 1995,7(6) :1129-1159. 被引量：1
5DOUGLAS S C. Blind separation of acoustic signals[ M ]//BRANDSTEIN M, WARD D. Microphone Arrays: Signal Processing Techniques and Applications. New York:Springer,2001. 被引量：1
6SMARAGDIS P. Blind separation of convolved mixtures in the frequency domain [ J ]. Neurocomputing, 1998,22 ( 1 ) :21 - 34. 被引量：1
7IKEDA S, MURATA N. A method of ICA in time-frequency domain [ C ]//Proc of International Conferenee on Independent Component Analysis and Signal Separation. 1999:365-371. 被引量：1
8PEDERSEN M S, LARSEN J, KJEMS U, et al. A survey of convolutive blind source separation methods [ M ]//BENESTY J, SONDHI M M, HUANG Y. Springer Handbook of Speech Processing. Berlin: Springer, 2007. 被引量：1
9COOKE M, LEE T W. The speech separation challenge[ EB/OL]. (2006) [ 2010-04-24 ]. http://www. dcs. shef. ac. uk/- martin/ SpcechSeparationChallenge. htm. 被引量：1
10NAKATANI T, OKUNO H G. Harmonic sound stream segregation using localization and its application to speech stream segregation[ J ]. Speech Communication, 1999,27 (3) :209-222. 被引量：1

共引文献7

1赵志强,颜学龙.基于EMD和ICA的单通道语音盲源分离算法[J].电子科技,2012,25(7):66-68. 被引量：5
2郭海燕,李枭雄,李拟珺,周琳,吴镇扬.基于基频状态和帧间相关性的单通道语音分离算法[J].东南大学学报（自然科学版）,2014,44(6):1099-1104. 被引量：1
3汤俊杰,李辉,戴旭初.实现单通道MPSK信号盲分离的MCMC新算法[J].信号处理,2014,30(11):1321-1328. 被引量：3
4杨龙.几种单通道的语音增强算法研究[J].科技视界,2015(26):155-155. 被引量：2
5TANG Jing-tian,LI Guang,ZHOU Cong,LI Jin,LIU Xiao-qiong,ZHU Hui-jie.Power-line interference suppression of MT data based on frequency domain sparse decomposition[J].Journal of Central South University,2018,25(9):2150-2163. 被引量：7
6王凯龙,张二华,曹冠彬.基于计算听觉场景分析的单通道信噪分离方法[J].计算机与数字工程,2019,47(5):1049-1054. 被引量：1
7江春冬,王景玉,杜太行,郝静,龙超.基于变分模态分解算法的单通道无线电混合信号分离[J].上海交通大学学报,2018,52(12):1618-1626. 被引量：9

同被引文献1

1葛宛营,张天骐,范聪聪,张天.噪声情况下采用稀疏非负矩阵分解与深度吸引子网络的人声分离算法[J].声学学报,2021,46(1):55-66. 被引量：4

引证文献1

1张锐,吕俊.基于分离结果信噪比估计与自适应调频网络的单通道语音分离技术[J].广东工业大学学报,2023,40(2):45-54. 被引量：1

二级引证文献1

1岳欢.基于GSP算法和增强现实技术的景观交互系统设计[J].自动化与仪器仪表,2023(12):109-113.

1曹偲,吴修坤,刘华平.基于频域稀疏自编码网络的音乐分离技术[J].电声技术,2020,44(6):91-94.
2陈恳,李炜,方刚.无管化微创经皮肾镜取石术对肾结石患者结石清除率、炎症因子的影响[J].医学临床研究,2020,37(10):1583-1585. 被引量：1
3李小珍.一种基于正则化方法的非负矩阵分解算法研究与应用[J].安阳师范学院学报,2020(5):12-15.
4薛琪薪.上海转型发展中的职住分离问题研讨会综述[J].高校社科动态,2020(3):7-9.
5王福菊,刘小榕,赵斯韦,巨国娇.基于运行环境的配电变压器运行系统可用度分析模型研究[J].电力与能源,2020,41(5):547-548.
6刘缓缓,张利峰,张磊.两种用于硼同位素分离的MOFs的合成[J].中国原子能科学研究院年报,2019(1):159-160.
7李有熠,何冉.基于属性网络语义表示的文本表示算法[J].新一代信息技术,2020,3(10):14-17.
8严正国,雷宇,王浩然,汤英,方履宽.基于矩阵分解的背景分离算法在油气井可视化检测中的应用[J].测井技术,2020,44(5):508-511. 被引量：1
9李旭,李茂林.双通道任意波形发生器PXIe模块设计与实现[J].电子质量,2020(10):145-148. 被引量：1
10麻寿东,吴立群,郭亚杰,庄龙,吴浩.超声驻波场中固液黏附液滴悬浮分离研究[J].声学技术,2020,39(5):581-585. 被引量：2

江西理工大学学报

2020年第5期

浏览历史

内容加载中请稍等...

基于GCC-NMF的语音分离研究被引量：1

参考文献4

二级参考文献68

共引文献7

同被引文献1

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于GCC-NMF的语音分离研究 被引量：1

参考文献4

二级参考文献68

共引文献7

同被引文献1

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于GCC-NMF的语音分离研究被引量：1