期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
听觉场景分析的研究进展 被引量:9
1
作者 吴镇扬 张子瑜 +1 位作者 李想 赵力 《电路与系统学报》 CSCD 2001年第2期68-73,共6页
本文综述了当前听觉场景分析的研究进展与发展方向。听觉场景分析包含心理听觉场景分析和计算听觉场景分析,前者揭示了人对声音的心理感知过程以及多声音信息流检测分离的规律;后者的目标是用计算机模仿人类听觉系统的处理机制,在噪... 本文综述了当前听觉场景分析的研究进展与发展方向。听觉场景分析包含心理听觉场景分析和计算听觉场景分析,前者揭示了人对声音的心理感知过程以及多声音信息流检测分离的规律;后者的目标是用计算机模仿人类听觉系统的处理机制,在噪声背景下分析提取所需声音信息,最终使机器具有听觉智能。 展开更多
关键词 听觉场景分析 计算听觉场景分析 语音信号处理
下载PDF
语音分离技术的研究现状与展望 被引量:10
2
作者 李从清 孙立新 +1 位作者 龙东 任晓光 《声学技术》 CSCD 北大核心 2008年第5期779-787,共9页
从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动... 从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动型,特点是信息由低级向高级和由高级向低级结合的双向流动。最后指出信息双向互流的混合语音分离模式将是未来计算听觉场景分析研究的主要模式;基于听觉和视觉的结合来改善语音分离效果的研究将是未来研究方向之一。此外,盲源分离的欠完全问题,非线性混叠信号的可分离性、非平稳混叠信号的盲分离问题都将需要进一步研究;基于CASA和BSS联合进行语音分离将是未来研究的热点。 展开更多
关键词 语音分离 听觉场景分析 计算听觉场景分析 盲源分离
下载PDF
感知听觉场景分析的说话人识别 被引量:4
3
作者 吴迪 陶智 +4 位作者 张晓俊 周燕 潘欣裕 肖仲喆 赵鹤鸣 《声学学报》 EI CSCD 北大核心 2016年第2期260-272,共13页
针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对... 针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能。实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别。 展开更多
关键词 说话人识别系统 听觉场景分析 感知特性 语音增强 鲁棒性能 特征方法 缺失数据 低信噪比
下载PDF
非线性统计匹配用于子带鲁棒语音识别 被引量:4
4
作者 孙暐 吴镇扬 刘海滨 《电子与信息学报》 EI CSCD 北大核心 2006年第3期480-484,共5页
由于语音信号的多变性,识别系统的性能极易受噪声环境的影响而导致性能下降。该文以听觉试验为基础,提出一种新的非线性独立子带隐马尔可夫模型(HMM)最大后验统计匹配算法。该算法依据人耳感知的频选性, 根据各子带噪声特点采用统计匹配... 由于语音信号的多变性,识别系统的性能极易受噪声环境的影响而导致性能下降。该文以听觉试验为基础,提出一种新的非线性独立子带隐马尔可夫模型(HMM)最大后验统计匹配算法。该算法依据人耳感知的频选性, 根据各子带噪声特点采用统计匹配、MAP估计和HMM/MLP非线性映射来补偿噪声环境的影响。实验表明该算法明显改善了识别系统在噪声环境下的性能。 展开更多
关键词 语音识别 隐马尔可夫模型 最大后验估计 听觉场景分析
下载PDF
低信噪比下二值掩蔽算法性能分析 被引量:3
5
作者 蒋毅 梁维谦 +1 位作者 周宏 冯振明 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第5期636-641,共6页
基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪... 基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪语音进行了分离实验,信噪比平均提升幅度大于10dB,表明算法对低信噪比语音分离的有效性和普遍适用性;采用非均匀、均匀两种多子带分析滤波器组进行分离性能对比测试,结果表明子带均匀性对信噪比提升影响不大。分析滤波器组的子带数量应大于32以实现较好的分离性能。 展开更多
关键词 语音分离 听觉场景分析 理想二值掩蔽 gammatone滤波器组
原文传递
多带抗噪声语音识别算法研究
6
作者 孙暐 吴镇扬 《信号处理》 CSCD 北大核心 2006年第4期559-563,共5页
根据Flether等人的研究,基于感知独立性假设的子带识别方法被用于抗噪声鲁棒语音识别。本文拓展子带方法,采用基于噪声污染假定的多带框架来减少噪声影响。论文不仅从理论上分析了噪声污染假定多带框架在识别性能上的潜在优势,而且提出... 根据Flether等人的研究,基于感知独立性假设的子带识别方法被用于抗噪声鲁棒语音识别。本文拓展子带方法,采用基于噪声污染假定的多带框架来减少噪声影响。论文不仅从理论上分析了噪声污染假定多带框架在识别性能上的潜在优势,而且提出了多带环境下的鲁棒语音识别算法。研究表明:多带框架不仅回避了独立感知假设要求,而且与子带方法相比,多带方法能更好的减少噪声影响,提高系统识别性能。 展开更多
关键词 语音识别 隐马尔可夫模型 听觉场景分析
下载PDF
基于双基频多带激励分离模型的元音分离 被引量:1
7
作者 黄秀轩 韦岗 《计算机工程与应用》 CSCD 北大核心 2003年第10期73-76,共4页
听觉场景分析(AuditorySceneAnalysis,ASA)是一种模仿人的听觉特性实现对混叠声音信号进行分离的方法。作为ASA的基础研究,论文针对各种ASA系统存在的相近频带信号无法有效分离问题,提出了一种新的基于双基频多带激励分离模型的元音分... 听觉场景分析(AuditorySceneAnalysis,ASA)是一种模仿人的听觉特性实现对混叠声音信号进行分离的方法。作为ASA的基础研究,论文针对各种ASA系统存在的相近频带信号无法有效分离问题,提出了一种新的基于双基频多带激励分离模型的元音分离系统,该系统利用两语音信号的基音轨迹特性提取多带激励分离模型中两基频对应的语音的各次谐波参数,将两组参数代入多带激励合成模型从而得到两个分离的语音信号。文中给出了算法的原理与具体描述。仿真实验结果表明,系统对存在基音频率差异的元音信号能实现有效的分离。 展开更多
关键词 分离模型 元音分离 听觉场景分析 双基频多带激励 语音信号处理 语音合成 语音编码
下载PDF
基于计算听觉场景分析的语音盲分离方法 被引量:1
8
作者 王卫华 黄凤岗 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2008年第4期395-399,共5页
人耳具有提取感兴趣的声音、屏蔽噪声以及定位的功能.利用人耳听觉机理的听觉场景分析技术是语音信号处理的有力工具.提出了一种新的基于听觉场景分析的盲分离方法,可以对多个源信号混合而成的2个传感器信号进行分离.耳间时间差(IT... 人耳具有提取感兴趣的声音、屏蔽噪声以及定位的功能.利用人耳听觉机理的听觉场景分析技术是语音信号处理的有力工具.提出了一种新的基于听觉场景分析的盲分离方法,可以对多个源信号混合而成的2个传感器信号进行分离.耳间时间差(ITD)和强度差(ⅡD)包含信号源的位置信息.通过听觉外周模型对混合信号进行处理,得到各个频率通道的ITD和ⅡD,再对混合信号的频域表示进行聚类,可得到源信号的频域表示.由于ITD和ⅡD分别在高低频段起主要作用,聚类时对高低频段采取了不同的分类准则.仿真实验表明了该方法的有效性. 展开更多
关键词 盲分离 听觉场景分析 听觉定位 聚类
下载PDF
基于计算听觉场景分析的单声道语音分离研究
9
作者 钱政 《北京印刷学院学报》 2020年第S02期276-278,共3页
根据系统中可用的传感器数量可以将研究方向分为多通道、双通道或单通道语音分离。其中,单通道语音分离的相应问题较难解决。本文重点介绍了单声道语音分离,使用计算机技术分析听觉场景,深入探讨了听觉分段、听觉重组和听觉特征分类,并... 根据系统中可用的传感器数量可以将研究方向分为多通道、双通道或单通道语音分离。其中,单通道语音分离的相应问题较难解决。本文重点介绍了单声道语音分离,使用计算机技术分析听觉场景,深入探讨了听觉分段、听觉重组和听觉特征分类,并提出了可以有效提高单通道语音分离效果的相应方法。 展开更多
关键词 听觉场景分析 单声道语音分离 听觉分割 听觉重组
下载PDF
基于计算听觉场景分析的单通道信噪分离方法 被引量:1
10
作者 王凯龙 张二华 曹冠彬 《计算机与数字工程》 2019年第5期1049-1054,共6页
受人耳的听觉特征启发,基于计算听觉场景分析(CASA)的基本原理,结合语音信号频谱的分布特征,建立了一套较完整的信噪分离方法,首先利用图谱分析方法准确提取各语音帧的基音周期,然后以此为依据构造说话人的频谱模板,加以适当的窗函数,... 受人耳的听觉特征启发,基于计算听觉场景分析(CASA)的基本原理,结合语音信号频谱的分布特征,建立了一套较完整的信噪分离方法,首先利用图谱分析方法准确提取各语音帧的基音周期,然后以此为依据构造说话人的频谱模板,加以适当的窗函数,对原频谱进行梳状滤波,将滤波结果进行反傅里叶变换得到分离后的语音,实验结果表明了该方法的有效性。 展开更多
关键词 听觉场景分析 单通道 信噪分离 基音周期
下载PDF
基于听觉场景分析的近讲语音增强算法 被引量:1
11
作者 胡奎 梁维谦 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第9期1176-1179,1186,共5页
针对近讲场景,提出一种双麦克近讲语音增强算法。该算法基于耳间延时差(ITD)、耳间强度差(IID)特征来区分目标语音,利用声学掩蔽效应,实现目标语音对背景噪声的分离降噪。与传统的单麦克增强方法相比,该算法可消除多种类型噪声且对语音... 针对近讲场景,提出一种双麦克近讲语音增强算法。该算法基于耳间延时差(ITD)、耳间强度差(IID)特征来区分目标语音,利用声学掩蔽效应,实现目标语音对背景噪声的分离降噪。与传统的单麦克增强方法相比,该算法可消除多种类型噪声且对语音造成的损伤较小。实验表明:该算法能将8~33dB的白噪声、音乐噪声、广播噪声3种噪声类型的带噪语音的信噪比提高到36dB以上,同时保持较高的目标语音可懂度。对于冲击噪声的带噪语音也具有较好的降噪效果。 展开更多
关键词 语音增强 听觉场景分析 耳间延时差 耳间能量差 声学掩蔽
原文传递
并行子带HMM最大后验概率自适应非线性类估计算法 被引量:1
12
作者 孙暐 吴镇扬 +1 位作者 刘海滨 周琳 《电路与系统学报》 CSCD 北大核心 2005年第6期20-24,共5页
目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化。本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提... 目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化。本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性。本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降。实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法。 展开更多
关键词 最大后验估计 隐马尔可夫模型 语音识别 听觉场景分析
下载PDF
基于计算听觉场景分析的单通道语音分离方法
13
作者 徐庆达 张二华 《计算机与数字工程》 2022年第3期597-602,共6页
人耳听觉系统能够从嘈杂的环境中筛选出自己感兴趣的语音,基于计算听觉场景分析的方法,论文采用倒谱法提取语音基音周期轨迹,以连续的基音周期轨迹为线索,按基音频率的整数倍提取各次谐波的频谱,再通过傅里叶逆变换重构分离后的语音。... 人耳听觉系统能够从嘈杂的环境中筛选出自己感兴趣的语音,基于计算听觉场景分析的方法,论文采用倒谱法提取语音基音周期轨迹,以连续的基音周期轨迹为线索,按基音频率的整数倍提取各次谐波的频谱,再通过傅里叶逆变换重构分离后的语音。实验表明,在几种典型噪音环境下,该方法能有效将目标语音从背景噪声中分离,信噪比(SNR)和评价意见分(MOS)得到一定的提升,平均增益分别为5.67dB和0.36。 展开更多
关键词 听觉场景分析 语音分离 基音周期
下载PDF
SPEECH SEPARATION ALGORITHM FOR AUDITORY SCENE ANALYSIS 被引量:1
14
作者 HuangXiuxuan WeiGang 《Journal of Electronics(China)》 2004年第3期261-264,共4页
A simple and efficient algorithm is presented to separate concurrent speeches. The parameters of mixed speeches are estimated by searching in the neighbor area of given pitches to minimize the error between the origin... A simple and efficient algorithm is presented to separate concurrent speeches. The parameters of mixed speeches are estimated by searching in the neighbor area of given pitches to minimize the error between the original and the synthetic spectrums. The effectiveness of the proposed algorithm to separate close frequencies is demonstrated. 展开更多
关键词 Auditory scene analysis Multi Band Excitation(MBE) PITCH
下载PDF
基于分频带自相关函数的混叠语音基频分离提取新算法 被引量:1
15
作者 黄秀轩 季飞 韦岗 《信号处理》 CSCD 2004年第5期490-493,共4页
混叠语音的基频分离提取问题是听觉场景分析系统的重要一环。以往的分频带自相关函数的混叠语音基频分离提取方法都是基于频带只受混叠信号之一支配的假设,而事实上,频带常常同时受两个信号影响,为此,本文提出了一种混叠语音基频分离提... 混叠语音的基频分离提取问题是听觉场景分析系统的重要一环。以往的分频带自相关函数的混叠语音基频分离提取方法都是基于频带只受混叠信号之一支配的假设,而事实上,频带常常同时受两个信号影响,为此,本文提出了一种混叠语音基频分离提取新算法,算法在寻找可能的频带组时采用了闭环自适应频带选取模块,根据频带组的基频及其周期度确定两个潜在基频,提高了搜索潜在基频的鲁棒性;利用两个潜在基频重新判断频带的归属来分离信号提取基频,提高了提取基频的精度。实验结果证明新算法具有较高的有效基频提取精度。 展开更多
关键词 混叠语音 基频 分频 频带 听觉场景分析 自相关函数 信号 新算法 鲁棒性 搜索
下载PDF
基于GCC-NMF的语音分离研究 被引量:1
16
作者 吴君钦 王迎福 《江西理工大学学报》 CAS 2020年第5期65-72,共8页
为了使盲源分离算法能更好地应用于一些实际噪声和训练数据较少且不需要做标记的环境,文章提出了一种无监督的非负矩阵字典学习方法。该方法对混合信号进行字典学习,随后在每个时间点上根据其空间源对字典原子进行分组来实现分离。通过... 为了使盲源分离算法能更好地应用于一些实际噪声和训练数据较少且不需要做标记的环境,文章提出了一种无监督的非负矩阵字典学习方法。该方法对混合信号进行字典学习,随后在每个时间点上根据其空间源对字典原子进行分组来实现分离。通过从SiSEC获取语音和现实噪声的两通道混合信号作为数据集,使用PEASS和BSS Eval工具包分别基于感知、基于SNR和PEMO-Q的度量来量化性能。此外,还评估模型了参数对分离质量的影响,并将该方法与其他无监督和半监督的语音分离方法进行比较。结果证明,GCC-NMF是一种灵活的源分离算法,在3种评估参数中的每个参数均胜过特定任务的方法,包括盲源以及需要先验知识或信息的多种已知方法。 展开更多
关键词 盲源分离 非负矩阵分解 听觉场景分析 广义互相关 字典学习
下载PDF
基于神经振荡器网络的计算听觉场景分析
17
作者 王想实 《湖南工业职业技术学院学报》 2008年第2期5-7,共3页
神经振荡器网络模型运用振荡元相关进行听觉场景分析,不同声源所激励的振荡元形成异步流,而同一声源激励的振荡元是同步的。在该模型的组合层中,引入阈值,可有效保留语音信息,提高了信噪比,最后合成的语音信息是可理解的。
关键词 神经振荡器网络 听觉场景分析 振荡元
下载PDF
一种混叠语音清浊音判断方法
18
作者 黄秀轩 韦岗 《计算机工程》 CAS CSCD 北大核心 2004年第18期29-30,140,共3页
提出了一种混叠语音清浊音判断方法。该方法在分频带自相关函数的混叠语音基频分离提取算法中,引入了双周期度及频带组的分布度两个参数用于对混叠语音清浊判断,从而使基于分频带自相关函数的混叠语音基频分离提取方法不再局限于浊音,... 提出了一种混叠语音清浊音判断方法。该方法在分频带自相关函数的混叠语音基频分离提取算法中,引入了双周期度及频带组的分布度两个参数用于对混叠语音清浊判断,从而使基于分频带自相关函数的混叠语音基频分离提取方法不再局限于浊音,可推广到清音信号。实验结果证明算法有一定的清浊音判断能力。 展开更多
关键词 听觉场景分析 自相关函数 清浊音判断
下载PDF
基于深度学习语音分离技术的研究现状与进展 被引量:68
19
作者 刘文举 聂帅 +1 位作者 梁山 张学良 《自动化学报》 EI CSCD 北大核心 2016年第6期819-833,共15页
现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入... 现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望. 展开更多
关键词 神经网络 语音分离 计算听觉场景分析 机器学习
下载PDF
机器人听觉定位跟踪声源的研究与进展 被引量:15
20
作者 李从清 孙立新 +1 位作者 戴士杰 李洙梁 《燕山大学学报》 CAS 2009年第3期199-205,共7页
从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基... 从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基于麦克风阵列的声源定位系统,盲波束形成技术是未来进一步研究内容。而基于人耳听觉机理的声源定位系统,运用计算听觉场景分析建立声源定位模型将是未来热点研究内容。 展开更多
关键词 机器人听觉 声源定位 麦克风阵列 计算听觉场景分析
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部