期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
面向语音通信与交互的麦克风阵列波束形成方法 被引量:21
1
作者 潘超 黄公平 陈景东 《信号处理》 CSCD 北大核心 2020年第6期804-815,共12页
临境语音通信与智能语音交互都面临复杂声学环境中的远距离高保真拾音难题,解决这一难题的有效途径是使用由多个麦克风传感器组成的麦克风阵列或多通道拾音系统,这种系统的核心是信号处理,通过对空间采样的声场信息进行时、空、频三域... 临境语音通信与智能语音交互都面临复杂声学环境中的远距离高保真拾音难题,解决这一难题的有效途径是使用由多个麦克风传感器组成的麦克风阵列或多通道拾音系统,这种系统的核心是信号处理,通过对空间采样的声场信息进行时、空、频三域的联合处理来实现声源定向/定位、信号增强、噪声抑制、混响抑制、声源分离、声场参数估计等功能。麦克风阵列信号处理的方法有很多,其中研究的最多、使用得最广的方法是波束形成。本文对麦克风阵列波束形成的原理、进展以及当前常用的方法进行简要综述,内容涵盖延迟求和、超指向、差分、正交级数展开、Kronecker和自适应波束形成方法。论文侧重于方法原理、机理和架构方面的探讨,具体的算法实现细节感兴趣的读者可以参考相应的文献。 展开更多
关键词 麦克风阵列 频不变波束形成 超指向波束形成 差分波束形成 Kronecker波束形成 自适应波束形成
下载PDF
基于深度学习的语音增强简述 被引量:6
2
作者 张晓雷 《网络新媒体技术》 2019年第2期1-8,共8页
语音增强是一种将语音从干扰声中增强出来的技术。它是语音信号处理的核心研究内容之一。近年来,深度学习在语音增强中的成功应用推动了该技术的快速发展。本文将简要回顾基于深度学习的语音增强技术。首先回顾语音增强中所采用的深度... 语音增强是一种将语音从干扰声中增强出来的技术。它是语音信号处理的核心研究内容之一。近年来,深度学习在语音增强中的成功应用推动了该技术的快速发展。本文将简要回顾基于深度学习的语音增强技术。首先回顾语音增强中所采用的深度学习算法和优化目标,在此基础上,将进一步回顾具有代表性的单声道深度语音增强技术、基于固定麦克风阵列的多声道深度语音增强技术、以及基于自组织阵列的多声道深度语音增强技术。 展开更多
关键词 深度学习 深度神经网络 语音增强 麦克风阵列
下载PDF
分布式网络的多任务扩散算法综述
3
作者 靳丹琦 陈捷 陈景东 《信号处理》 CSCD 北大核心 2023年第11期1901-1918,共18页
在分布式网络中,如何从带噪的实时数据流中估计潜在的模型参数是一个非常重要而极具挑战的问题。应对该问题的一种有效途径是设计扩散算法,通过网络局部信息交换和自组织协同方式来估计网络中所有节点的模型参数。相关方面早期的研究主... 在分布式网络中,如何从带噪的实时数据流中估计潜在的模型参数是一个非常重要而极具挑战的问题。应对该问题的一种有效途径是设计扩散算法,通过网络局部信息交换和自组织协同方式来估计网络中所有节点的模型参数。相关方面早期的研究主要关注的是单任务问题,即所有节点估计同一个模型参数。但实际应用中不同节点往往需要应对不同的估计任务,同时多个待估计的模型参数又可能具备一定的关联性,所以近年来人们将研究重点聚焦到了多任务问题,包括多任务关系建模以及参数优化问题的设计与求解等,并取得了一些重要进展。本文对分布式网络中多任务问题的建模以及当前常用的多任务扩散算法进行简要综述,内容涵盖无监督类型的扩散算法和有监督类型的扩散算法等。具体而言,针对使用无监督方式设计多任务扩散算法,介绍了静态组合矩阵的选取、自适应组合矩阵的设计、两个组合矩阵的组合结构,并简单讨论了三者的适用场景。针对使用有监督方式设计多任务扩散算法,讨论了基于梯度投影法和正则化架构的两种设计方式,并借助文献中的一些典型算法对这些设计方式进行说明。论文侧重于算法原理、算法架构和求解思路等方面的探讨,具体的算法实现细节感兴趣的读者可以参考相应的文献。 展开更多
关键词 分布式参数估计 自适应滤波 扩散算法 多任务 无监督算法 有监督算法
下载PDF
用于语音控制的低资源关键词检索系统 被引量:1
4
作者 徐梦龙 张晓雷 《信号处理》 CSCD 北大核心 2020年第6期879-884,共6页
基于深度神经网络的低资源条件下关键词检索已经取得了很大的进展,但这些方法仍旧需要较多的参数才能保证模型的精度。为了进一步减少模型的参数量,本文将Squeeze-and-Excitation网络和深度可分离卷积应用在关键词检索任务中。首先利用S... 基于深度神经网络的低资源条件下关键词检索已经取得了很大的进展,但这些方法仍旧需要较多的参数才能保证模型的精度。为了进一步减少模型的参数量,本文将Squeeze-and-Excitation网络和深度可分离卷积应用在关键词检索任务中。首先利用Squeeze-and-Excitation网络对不同特征通道之间的相互依赖关系建模的能力进一步提升模型的精度,然后通过将标准卷积替换为深度可分离卷积来有效的减少模型所需要的参数。在谷歌语音命令数据集上的实验证明我们的模型可以在保证高精度的同时把参数量限制在一定的范围内。 展开更多
关键词 关键词检索 Squeeze-and-Excitation网络 深度可分离卷积
下载PDF
基于语音分离的人工设计特征、参数化特征和可学习特征的比较
5
作者 朱文博 王谋 +1 位作者 张晓雷 Susanto Rahardja 《中国传媒大学学报(自然科学版)》 2021年第3期52-57,共6页
声学特征可以大致分为三类:人工设计特征,参数化特征和可学习特征。其中,可学习特征是指将其与分离网络以端到端的方式进行联合训练,如时域卷积语音分离网络(convolutional time domain audio separation network,Conv‑Tasnet),这成为... 声学特征可以大致分为三类:人工设计特征,参数化特征和可学习特征。其中,可学习特征是指将其与分离网络以端到端的方式进行联合训练,如时域卷积语音分离网络(convolutional time domain audio separation network,Conv‑Tasnet),这成为了如今语音分离研究中的一种新的趋势。然而在最近的研究中证明了人工设计特征以及参数化特征也能产生具有竞争力的结果。但是,截止目前还没有工作对这三种声学特征进行系统的比较。本文通过设置不同声学特征作为编码器和解码器,在Conv‑Tasnet框架下对它们进行比较。我们还将人工设计的多相位gammatone滤波器组(multi‑phase gammatone filterbank,MPGTF)扩展为一种新的参数化多相位gammatone滤波器组(Parameterized MPGTF,ParaMPGTF)。在WSJ0‑2mix数据集上的实验结果表明:(i)如果解码器是可学习特征时,将编码器设置为STFT,MPGTF,ParaMPGTF以及可学习特征的性能相近;(ii)如果将STFT,MPGTF,ParaMPGTF的逆变换作为解码器时,所提出的ParaMPGTF相比于其他两种人工设计特征有更好的性能。 展开更多
关键词 语音分离 人工设计特征 参数化特征 可学习特征 多相位gammatone滤波器组
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部