基于声音定位和听觉掩蔽效应的语音分离研究被引量：16

Speech Separation Based on Sound Localization and Auditory Masking Effect

下载PDF

导出

摘要人耳具有在嘈杂环境中将感兴趣的语言信息提取出来的能力 ,而双耳听觉特性有助于这种能力的加强 .据此本文提出了一种基于声音定位和听觉掩蔽效应的混叠语音分离方法 .根据声音到达双耳的时间差和强度差在时频域内确定相应的掩蔽系数 ,该系数是二值的 ,以直接去除干扰信号 ,保留有用信号并达到语音分离的目的 .实验表明 ,本文提出的方法是有效的 .该方法不仅适用于混叠语音为浊音情形 ,对清音的情况同样适用 ,因而比基于基音提取的语音分离方法的适用范围更广 . Human has the ability to attend to a single interested speech in a noised condition and this ability can be improved in the presence of binaural cues. In this paper a speech separation method is presented based on sound localization and auditory masking effect. By two important parameters-the interaural time differences (ITD) and interaural intensity differences (IID)-we estimate the binary masking coefficients in corresponding time-frequency regions. The coefficients are helpful of speech separation by holding interested signal and reducing noise signal. Experiments indicate that the approach described here is efficient not only for voiced speech but also for unvoiced speech and it has more extensive applications than pitch-based speech separation algorithms.

作者赵鹤鸣葛良陈雪勤俞一彪

机构地区苏州大学电子信息学院

出处《电子学报》 EI CAS CSCD 北大核心 2005年第1期158-160,共3页 Acta Electronica Sinica

基金国家自然科学基金 (No 60 1 72 0 1 6)

关键词双耳时间差双耳强度差声音定位语音分离掩蔽效应 Algorithms Audition Estimation Signal processing Speech intelligibility

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献12

1梁之安著..听觉感受和辨别的神经机制[M].上海:上海科技教育出版社,1999:262.
2D L Wang, G J Brown.Separation of speech from inlerfering sounds based on oscillatory correlation[J].IEEE Trans,1999,NN-10(3):684- 697. 被引量：1
3G J Brown, M Cooke. Computational auditory scene analysis [J].Computer Speech and Language, 1994,8(24) :297 - 336. 被引量：1
4D F Rosenthal, H G Okuno. Computational Auditory Scene Analysis[M]. Mahwah: Lawrence Erlbaum, 1998. 被引量：1
5W Roman, D L Wang. Speech segregation based on sound localization[A]. Proc IJCNN[C]. Washington DC : IEEE,2001. 2861 - 2866. 被引量：1
6A J W Kouwe, D L Wang. A Comparison of Auditory and Blind Separation Techniques for Speech Segregation[J]. IEEE Trans,2001,SAP-9(3) : 189 - 194. 被引量：1
7W Gardner, K Martin. HRTF measurements of a KEMAR[J] .J Acoust Soc Am, 1995,97(6) :3901 - 3908. 被引量：1
8R Patterson, et al. An efficient auditory filterbank based on the gammatone functions[R]. APU Report No. 2341, Cambrige, Applied Psychology Unit. 1988. 被引量：1
9F Wightman, D Kistler. The dominant role of low-frequency interaural time differences in sound localization[J] .J Acoust Soc Am. 1992,91(3) : 1648 - 1660. 被引量：1
10J Blauert. Spatial Hearing-The Psychophysics of Human Sound Localization[ M]. Cambridge: MIT Press, 1997. 被引量：1

同被引文献185

1李慧强,程广河,王茂励,伊晓峰.基于ARM的编译型可编程序控制器系统研究[J].自动化与仪表,2009,24(10):42-44. 被引量：3
2曹志刚,郑文涛.基于短时谱最小均方误差估计的语音增强和剩余噪声衰减[J].电子学报,1993,21(4):7-12. 被引量：7
3黄秀轩,季飞,韦岗.基于分频带自相关函数的混叠语音基频分离提取新算法[J].信号处理,2004,20(5):490-493. 被引量：1
4汪雄良,王春玲.基于改进基追踪方法的信号去噪[J].电子技术应用,2005,31(8):19-21. 被引量：3
5汪雄良,王正明.基于快速基追踪算法的图像去噪[J].计算机应用,2005,25(10):2356-2358. 被引量：6
6彭圆,王晟,王科俊,李雪耀,林良骥,林正青,王建文.感知线性预测在水下目标分类中的应用研究[J].声学学报,2006,31(2):146-150. 被引量：16
7钟静,傅彦.基于快速ICA的混合语音信号分离[J].计算机应用,2006,26(5):1120-1121. 被引量：12
8张敬春,谷爱昱,王战盟.基于盲分离的电机故障诊断[J].电力系统及其自动化学报,2006,18(4):67-70. 被引量：6
9赵彩华,刘琚,孙建德,闫华.基于小波变换和独立分量分析的含噪混叠语音盲分离[J].电子与信息学报,2006,28(9):1565-1568. 被引量：14
10张小兵,马建仓,陈翠华,刘恒.基于最大信噪比的盲源分离算法[J].计算机仿真,2006,23(10):72-75. 被引量：27

引证文献16

1孙蒙,王正明.两类混合特征信号的超完备稀疏表示方法[J].电子学报,2007,35(7):1327-1332. 被引量：3
2王卫华,黄凤岗.基于计算听觉场景分析的语音盲分离方法[J].哈尔滨工程大学学报,2008,29(4):395-399. 被引量：1
3易盟,史仪凯,袁小庆.一种用于叶蝉鸣声信号的采集与分离方法研究[J].计算机工程与应用,2008,44(24):151-152.
4李从清,孙立新,龙东,任晓光.语音分离技术的研究现状与展望[J].声学技术,2008,27(5):779-787. 被引量：10
5曹洁,魏建勇.杂波环境下基于视听信息融合的目标跟踪[J].兰州理工大学学报,2009,35(3):85-89. 被引量：1
6陈益如,王博,邬杨波.基于声音导引的声源定位系统设计[J].工业控制计算机,2010,23(10):101-102. 被引量：7
7胡胜,杨雷,宋跃,张志坚,李君,黄海明.基于ARM7的声音导引系统的设计[J].自动化与仪表,2010,25(12):46-49. 被引量：2
8王磊,彭圆,林正青,蒋行海,牟林,张凤珍.听觉外周计算模型在水中目标分类识别中的应用[J].电子学报,2012,40(1):199-203. 被引量：21
9罗元,童开国,张毅,邢武超,陈凯,陈红松,何春江,陈君.多个声源下基于人耳听觉特性的语音分离[J].智能系统学报,2012,7(2):121-128.
10王雨,林家骏,袁文浩,陈宁.基于计算听觉场景分析的改进清音分离方法[J].华东理工大学学报（自然科学版）,2014,40(2):212-217. 被引量：3

二级引证文献54

1汪玉凤,夏元涛,王晓晨.含噪超完备独立分量分析在综放煤岩识别中的应用[J].煤炭学报,2011,36(S1):203-206. 被引量：11
2郑燕琳,杨晓炯,许星宇.电话语音中基于多说话人的声纹识别系统[J].电信科学,2010,26(S2):105-108.
3曹洁,魏建勇.杂波环境下基于视听信息融合的目标跟踪[J].兰州理工大学学报,2009,35(3):85-89. 被引量：1
4李从清,孙立新,戴士杰,武方.声源定位分离技术在机器人领域的应用[J].电声技术,2010,34(1):49-53. 被引量：2
5王进花,曹洁.基于改进“当前”统计模型和AKF的机动目标跟踪[J].兰州理工大学学报,2010,36(4):98-101. 被引量：3
6张学良,刘文举,李鹏,徐波.改进谐波组织规则的单通道浊语音分离系统[J].声学学报,2011,36(1):88-96. 被引量：7
7郭德全,杨红雨,刘东权,何文森.基于稀疏性的图像去噪综述[J].计算机应用研究,2012,29(2):406-413. 被引量：21
8李军,李振杰,郭博.基于ARM7及nRF905的智能小车系统设计[J].阜阳师范学院学报（自然科学版）,2012,29(2):73-76. 被引量：2
9周晖,张俊,徐荣华,朱松盛,徐暑,徐月明.基于超声导引的药品自动搬移系统的研制[J].计算机与现代化,2012(8):195-197.
10千承辉,陈思宇,吕超林,王超.基于msp430的二维声源定位系统[J].中国科技博览,2013(1):225-225.

1陈艳,刘景景.基于独立分量分析的盲信号分离研究[J].中国西部科技,2009,8(3):41-43. 被引量：1
2MAX3625B：三路输出时钟发生器[J].世界电子元器件,2010(1):39-39.
3利用智能语音处理器实现嘈杂环境下的语音识别[J].集成电路应用,2013(7):23-23.
4贾鹏.手机通话更清晰[J].科技新时代,2009(7):60-60.
5陈鑫.把它们都藏在墙里面[J].建材与装修情报,2012,0(5):132-134.
6赵鹤鸣,朱美虹,陈雪勤,肖筱华.基于声场景分析的混叠语音分离研究[J].通信技术,2002,35(1X):4-5. 被引量：4
7李冰,夏秀渝,申庆超,周宁.基于过零点双耳时间差的运动声源定位[J].计算机工程与应用,2012,48(9):127-130. 被引量：2
8龚玫,肖峥,曲天书,吴玺宏,李晓东.近场头相关传输函数的测量与分析[J].应用声学,2007,26(6):326-334. 被引量：11
9谢菠荪,钟小丽,饶丹,梁志强.头相关传输函数数据库及其特性分析[J].中国科学（G辑）,2006,36(5):464-479. 被引量：19
10谢菠荪,钟小丽,饶丹,梁志强.声学：头相关传输函数数据库及其特性分析[J].中国学术期刊文摘,2007,13(5):34-34.

电子学报

2005年第1期

浏览历史

内容加载中请稍等...

基于声音定位和听觉掩蔽效应的语音分离研究被引量：16

参考文献12

同被引文献185

引证文献16

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于声音定位和听觉掩蔽效应的语音分离研究 被引量：16

参考文献12

同被引文献185

引证文献16

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于声音定位和听觉掩蔽效应的语音分离研究被引量：16