期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
重塑听觉:数字媒介中的声音与景观 被引量:1
1
作者 黄琳 秦卓伦 《中国电视》 CSSCI 北大核心 2024年第3期21-27,共7页
数字技术尤其是空间音频技术的快速突破,在一定程度上带来了声音形态的扩展和听觉空间的重塑。伴随着听觉的强化与感知的延伸,数字时代的声音媒介也从拟真“再现”走向了更为复杂的“再生产”。人机协同下听觉主体、听觉场景的交互重构... 数字技术尤其是空间音频技术的快速突破,在一定程度上带来了声音形态的扩展和听觉空间的重塑。伴随着听觉的强化与感知的延伸,数字时代的声音媒介也从拟真“再现”走向了更为复杂的“再生产”。人机协同下听觉主体、听觉场景的交互重构,改变了声音、人与社会情境的关系,也加速了视听创作在听觉空间、声音景观和声音想象力维度上新的拓展。 展开更多
关键词 空间音频技术 智能终端 听觉场景 声音景观 跨感知联动
原文传递
听觉场景分析简析
2
作者 王想实 《技术与市场》 2011年第6期222-222,224,共2页
介绍了听觉场景分析中的一些准则,听觉场景的分类及应用目标。
关键词 信号 听觉场景 识别
下载PDF
基于深度学习语音分离技术的研究现状与进展 被引量:70
3
作者 刘文举 聂帅 +1 位作者 梁山 张学良 《自动化学报》 EI CSCD 北大核心 2016年第6期819-833,共15页
现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入... 现阶段,语音交互技术日益在现实生活中得到广泛的应用,然而,由于干扰的存在,现实环境中的语音交互技术远没有达到令人满意的程度.针对加性噪音的语音分离技术是提高语音交互性能的有效途径,几十年来,全世界范围内的许多研究者为此投入了巨大的努力,提出了很多实用的方法.特别是近年来,由于深度学习研究的兴起,基于深度学习的语音分离技术日益得到了广泛关注和重视,显露出了相当光明的应用前景,逐渐成为语音分离中一个新的研究趋势.目前已有很多基于深度学习的语音分离方法被提出,但是,对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结,不同方法之间的联系和区分也很少被研究.针对这个问题,本文试图对语音分离的主要流程和整体框架进行细致的分析和总结,从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述,最后对语音分离技术进行展望. 展开更多
关键词 神经网络 语音分离 计算听觉场景分析 机器学习
下载PDF
机器人听觉定位跟踪声源的研究与进展 被引量:15
4
作者 李从清 孙立新 +1 位作者 戴士杰 李洙梁 《燕山大学学报》 CAS 2009年第3期199-205,共7页
从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基... 从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向。首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势。基于麦克风阵列的声源定位系统,盲波束形成技术是未来进一步研究内容。而基于人耳听觉机理的声源定位系统,运用计算听觉场景分析建立声源定位模型将是未来热点研究内容。 展开更多
关键词 机器人听觉 声源定位 麦克风阵列 计算听觉场景分析
下载PDF
听觉场景分析的研究进展 被引量:9
5
作者 吴镇扬 张子瑜 +1 位作者 李想 赵力 《电路与系统学报》 CSCD 2001年第2期68-73,共6页
本文综述了当前听觉场景分析的研究进展与发展方向。听觉场景分析包含心理听觉场景分析和计算听觉场景分析,前者揭示了人对声音的心理感知过程以及多声音信息流检测分离的规律;后者的目标是用计算机模仿人类听觉系统的处理机制,在噪... 本文综述了当前听觉场景分析的研究进展与发展方向。听觉场景分析包含心理听觉场景分析和计算听觉场景分析,前者揭示了人对声音的心理感知过程以及多声音信息流检测分离的规律;后者的目标是用计算机模仿人类听觉系统的处理机制,在噪声背景下分析提取所需声音信息,最终使机器具有听觉智能。 展开更多
关键词 听觉场景分析 计算听觉场景分析 语音信号处理
下载PDF
语音分离技术的研究现状与展望 被引量:10
6
作者 李从清 孙立新 +1 位作者 龙东 任晓光 《声学技术》 CSCD 北大核心 2008年第5期779-787,共9页
从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动... 从计算听觉场景分析和盲源分离两种方法综述了当前语音分离技术的研究现状和发展方向。计算听觉场景分析是用计算机来模拟人类听觉系统的处理机制。它可分为两大类:一类是数据驱动型,特点是信息由低级向高级的单向流动;另一类是图式驱动型,特点是信息由低级向高级和由高级向低级结合的双向流动。最后指出信息双向互流的混合语音分离模式将是未来计算听觉场景分析研究的主要模式;基于听觉和视觉的结合来改善语音分离效果的研究将是未来研究方向之一。此外,盲源分离的欠完全问题,非线性混叠信号的可分离性、非平稳混叠信号的盲分离问题都将需要进一步研究;基于CASA和BSS联合进行语音分离将是未来研究的热点。 展开更多
关键词 语音分离 听觉场景分析 计算听觉场景分析 盲源分离
下载PDF
基于掩蔽估计与优化的单通道语音增强算法 被引量:9
7
作者 葛宛营 张天骐 《计算机应用》 CSCD 北大核心 2019年第10期3065-3070,共6页
单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针... 单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针对此问题,提出一种基于计算听觉场景分析(CASA)的时频掩蔽估计与优化算法。首先,通过直接判决(DD)算法估计先验信噪比(SNR)并计算初始掩蔽;其次,利用噪声与带噪语音在Gammatone频带内的互相关(ICC)系数来计算噪声的存在概率,结合带噪语音能量谱得到新的噪声估计,减少原估计噪声中的过估成分;然后,利用优化算法对初始掩蔽进行迭代处理以减少其中因噪声过估而存在的误差并增加其中的目标语音成分,在满足条件后停止迭代并得到新的掩蔽;最后,利用新的掩蔽合成增强语音。实验结果表明在不同的背景噪声下,相比优化前,新的掩蔽使增强语音获得了较高的主观语音质量(PESQ)和语音可懂度(STOI)值,提升了语音听感与可懂度。 展开更多
关键词 计算听觉场景分析 语音增强 时频掩蔽 噪声估计 掩蔽优化 语音可懂度
下载PDF
基于计算听觉场景分析的混合语音信号分离算法研究 被引量:6
8
作者 屈俊玲 李鸿燕 《计算机应用研究》 CSCD 北大核心 2014年第12期3822-3824,共3页
人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊... 人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊语音信号分离算法。在白噪声、鸡尾酒会噪声等六种噪声干扰条件下,通过仿真实验结果表明,相比于传统的谱减法,语音分离算法的输出信噪比平均提高了7.47 d B,并有效抑制了干扰噪声,改善了分离效果。 展开更多
关键词 语音分离 计算听觉场景分析 基音 分段 听觉
下载PDF
计算听觉场景分析介绍 被引量:1
9
作者 邱伟 黄秀轩 《高技术通讯》 EI CAS CSCD 2002年第1期106-110,共5页
介绍了计算听觉场景分析的研究内容、理论依据、归类线索及意义 ,并以听觉的两大类型 (数据驱动及图式驱动 )为框架较详细地阐述了计算听觉场景分析系统的主要结构及研究进展 。
关键词 计算听觉场景分析 听觉模型 声源分离 数据驱动 图式驱动 声音识别
下载PDF
非线性统计匹配用于子带鲁棒语音识别 被引量:4
10
作者 孙暐 吴镇扬 刘海滨 《电子与信息学报》 EI CSCD 北大核心 2006年第3期480-484,共5页
由于语音信号的多变性,识别系统的性能极易受噪声环境的影响而导致性能下降。该文以听觉试验为基础,提出一种新的非线性独立子带隐马尔可夫模型(HMM)最大后验统计匹配算法。该算法依据人耳感知的频选性, 根据各子带噪声特点采用统计匹配... 由于语音信号的多变性,识别系统的性能极易受噪声环境的影响而导致性能下降。该文以听觉试验为基础,提出一种新的非线性独立子带隐马尔可夫模型(HMM)最大后验统计匹配算法。该算法依据人耳感知的频选性, 根据各子带噪声特点采用统计匹配、MAP估计和HMM/MLP非线性映射来补偿噪声环境的影响。实验表明该算法明显改善了识别系统在噪声环境下的性能。 展开更多
关键词 语音识别 隐马尔可夫模型 最大后验估计 听觉场景分析
下载PDF
感知听觉场景分析的说话人识别 被引量:4
11
作者 吴迪 陶智 +4 位作者 张晓俊 周燕 潘欣裕 肖仲喆 赵鹤鸣 《声学学报》 EI CSCD 北大核心 2016年第2期260-272,共13页
针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对... 针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能。实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别。 展开更多
关键词 说话人识别系统 听觉场景分析 感知特性 语音增强 鲁棒性能 特征方法 缺失数据 低信噪比
下载PDF
基于改进基音跟踪算法的单通道语音分离 被引量:4
12
作者 王雨 林家骏 +1 位作者 袁文浩 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第3期338-344,共7页
基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取... 基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。 展开更多
关键词 语音分离 计算听觉场景分析 目标源估计 基音跟踪
下载PDF
基于信号能量的浊语音盲信号分离算法 被引量:2
13
作者 李鸿燕 屈俊玲 张雪英 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第5期1665-1670,共6页
针对以往单声道浊语音分离算法对目标语音信号分离不稳定性和信噪比低的不足,引入了浊语音的另一个重要特征,即信号能量。提出了一种基于信号能量的浊语音分离算法,算法对经典的Hu-Wang算法进行了改进,将能量特征应用于听觉重组部分,通... 针对以往单声道浊语音分离算法对目标语音信号分离不稳定性和信噪比低的不足,引入了浊语音的另一个重要特征,即信号能量。提出了一种基于信号能量的浊语音分离算法,算法对经典的Hu-Wang算法进行了改进,将能量特征应用于听觉重组部分,通过能量特征来改进目标语音听觉流的重组性能,降低噪声对重组后的目标听觉流的干扰,提高算法的稳定性。实验结果表明:与Hu-Wang算法相比较,该改进算法可提高目标语音的分段信噪比,改善了目标浊语音的分离性能。 展开更多
关键词 通信技术 计算听觉场景分析 语音分离 信号能量 听觉片段 听觉
下载PDF
低信噪比下二值掩蔽算法性能分析 被引量:3
14
作者 蒋毅 梁维谦 +1 位作者 周宏 冯振明 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第5期636-641,共6页
基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪... 基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪语音进行了分离实验,信噪比平均提升幅度大于10dB,表明算法对低信噪比语音分离的有效性和普遍适用性;采用非均匀、均匀两种多子带分析滤波器组进行分离性能对比测试,结果表明子带均匀性对信噪比提升影响不大。分析滤波器组的子带数量应大于32以实现较好的分离性能。 展开更多
关键词 语音分离 听觉场景分析 理想二值掩蔽 gammatone滤波器组
原文传递
基于计算听觉场景分析的单声道浊音分离 被引量:3
15
作者 张丽娜 张二华 江军亮 《计算机工程与科学》 CSCD 北大核心 2019年第7期1266-1272,共7页
针对单声道语音分离中浊音分离的问题,提出了一种准确估计基音周期的方法。首先,以语音的短时平稳性和基音周期的连续性等为线索,利用语音信号的倒谱峰值构成基音周期谱图,并自动提取基音周期轨迹。然后,利用谐波频率为基音频率整数倍... 针对单声道语音分离中浊音分离的问题,提出了一种准确估计基音周期的方法。首先,以语音的短时平稳性和基音周期的连续性等为线索,利用语音信号的倒谱峰值构成基音周期谱图,并自动提取基音周期轨迹。然后,利用谐波频率为基音频率整数倍的性质来拾取各次谐波的频谱。最后,通过傅里叶逆变换对浊音进行重构。实验结果表明,该方法能准确提取基音周期轨迹,有效分离浊音信号。 展开更多
关键词 计算听觉场景分析 语音分离 基音周期轨迹 浊音
下载PDF
一种基于CASA的单通道语音增强方法 被引量:3
16
作者 余世经 李冬梅 刘润生 《电声技术》 2014年第2期50-54,共5页
基于对计算听觉场景分析(Computational Auditory Scene Analysis,CASA)算法思想的研究,提出了一种单通道语音增强方法。通过分析白噪声、风噪声、周期性噪声三类典型噪声和一般语音信号的频谱特点,构造适合的信号提取特征作为线索,判... 基于对计算听觉场景分析(Computational Auditory Scene Analysis,CASA)算法思想的研究,提出了一种单通道语音增强方法。通过分析白噪声、风噪声、周期性噪声三类典型噪声和一般语音信号的频谱特点,构造适合的信号提取特征作为线索,判别出信号时频单元中的主要信号成分,然后对各时频单元乘以相应的衰减系数以掩蔽噪声成分。对仿真实验结果的客观测试和非正式听音测试表明,相对于常用的多子带谱减法和维纳滤波法,所提出的算法能够更有效地抑制白噪声、风噪声、周期性噪声等背景噪声。 展开更多
关键词 语音增强 计算听觉场景分析 线索 掩蔽
下载PDF
基于计算听觉场景分析的改进清音分离方法 被引量:3
17
作者 王雨 林家骏 +1 位作者 袁文浩 陈宁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第2期212-217,共6页
基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减... 基于计算听觉场景分析(CASA)的单通道语音分离方法在浊音分离领域已发展得较为成熟,然而由于清音信号具有较小的能量且不包含周期性基音特征,因此清音分离具有较大的困难。根据噪声信号分布的不确定性和不稳定性,提出了基于CASA和谱减的改进清音分离方法。改进方法在剔除了浊音块后,通过基于距离加权的残余噪声估计算法得到每个清音单元中所包含的噪声能量,对每个清音单元进行谱减算法并标记,进一步剔除残余噪声单元,提取出清音信号。实验结果证明:与传统清音分离方法相比,改进方法对时变性残余噪声能量的估计结果更加精确,更能提高清音分离的有效性。 展开更多
关键词 清音分离 计算听觉场景分析 谱减 残余噪声估计
下载PDF
基于计算听觉场景分析的混合语音分离 被引量:2
18
作者 张磊 刘继芳 项学智 《计算机工程》 CAS CSCD 北大核心 2010年第14期24-25,31,共3页
基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分... 基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分析,得出onset/offset线索可以同时处理清音和浊音,对声音混合类型没有限制,能得到较好的分离效果。 展开更多
关键词 计算听觉场景分析 起始和结束时间 片段
下载PDF
基于计算听觉场景分析的混叠语音分离算法 被引量:1
19
作者 王忠文 谢莉萍 梁杰豪 《电声技术》 2008年第10期56-59,62,共5页
提出了一种改进的混叠语音信号分离算法,该算法采用改进的黑板模型计算听觉场景分析结构,快速准确计算混叠语音信号的特征参数;利用中频特性和人的听觉感知机理,模拟了听觉神经元的发放特性,分离出不同声源的语音信号和噪声信号。通过以... 提出了一种改进的混叠语音信号分离算法,该算法采用改进的黑板模型计算听觉场景分析结构,快速准确计算混叠语音信号的特征参数;利用中频特性和人的听觉感知机理,模拟了听觉神经元的发放特性,分离出不同声源的语音信号和噪声信号。通过以上2个部分的处理将输入的混叠语音信号在时频域上分割为若干有听觉意义的语音段,再聚类和重构输出不同声源的纯净语音信号。 展开更多
关键词 计算听觉场景分析 听觉感知段 语音信号分离 聚类和重构
下载PDF
基于双基频多带激励分离模型的元音分离 被引量:1
20
作者 黄秀轩 韦岗 《计算机工程与应用》 CSCD 北大核心 2003年第10期73-76,共4页
听觉场景分析(AuditorySceneAnalysis,ASA)是一种模仿人的听觉特性实现对混叠声音信号进行分离的方法。作为ASA的基础研究,论文针对各种ASA系统存在的相近频带信号无法有效分离问题,提出了一种新的基于双基频多带激励分离模型的元音分... 听觉场景分析(AuditorySceneAnalysis,ASA)是一种模仿人的听觉特性实现对混叠声音信号进行分离的方法。作为ASA的基础研究,论文针对各种ASA系统存在的相近频带信号无法有效分离问题,提出了一种新的基于双基频多带激励分离模型的元音分离系统,该系统利用两语音信号的基音轨迹特性提取多带激励分离模型中两基频对应的语音的各次谐波参数,将两组参数代入多带激励合成模型从而得到两个分离的语音信号。文中给出了算法的原理与具体描述。仿真实验结果表明,系统对存在基音频率差异的元音信号能实现有效的分离。 展开更多
关键词 分离模型 元音分离 听觉场景分析 双基频多带激励 语音信号处理 语音合成 语音编码
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部