期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向语音通信与交互的麦克风阵列波束形成方法
被引量:
21
1
作者
潘超
黄公平
陈景东
《信号处理》
CSCD
北大核心
2020年第6期804-815,共12页
临境语音通信与智能语音交互都面临复杂声学环境中的远距离高保真拾音难题,解决这一难题的有效途径是使用由多个麦克风传感器组成的麦克风阵列或多通道拾音系统,这种系统的核心是信号处理,通过对空间采样的声场信息进行时、空、频三域...
临境语音通信与智能语音交互都面临复杂声学环境中的远距离高保真拾音难题,解决这一难题的有效途径是使用由多个麦克风传感器组成的麦克风阵列或多通道拾音系统,这种系统的核心是信号处理,通过对空间采样的声场信息进行时、空、频三域的联合处理来实现声源定向/定位、信号增强、噪声抑制、混响抑制、声源分离、声场参数估计等功能。麦克风阵列信号处理的方法有很多,其中研究的最多、使用得最广的方法是波束形成。本文对麦克风阵列波束形成的原理、进展以及当前常用的方法进行简要综述,内容涵盖延迟求和、超指向、差分、正交级数展开、Kronecker和自适应波束形成方法。论文侧重于方法原理、机理和架构方面的探讨,具体的算法实现细节感兴趣的读者可以参考相应的文献。
展开更多
关键词
麦克风阵列
频不变波束形成
超指向波束形成
差分波束形成
Kronecker波束形成
自适应波束形成
下载PDF
职称材料
基于深度学习的语音增强简述
被引量:
6
2
作者
张晓雷
《网络新媒体技术》
2019年第2期1-8,共8页
语音增强是一种将语音从干扰声中增强出来的技术。它是语音信号处理的核心研究内容之一。近年来,深度学习在语音增强中的成功应用推动了该技术的快速发展。本文将简要回顾基于深度学习的语音增强技术。首先回顾语音增强中所采用的深度...
语音增强是一种将语音从干扰声中增强出来的技术。它是语音信号处理的核心研究内容之一。近年来,深度学习在语音增强中的成功应用推动了该技术的快速发展。本文将简要回顾基于深度学习的语音增强技术。首先回顾语音增强中所采用的深度学习算法和优化目标,在此基础上,将进一步回顾具有代表性的单声道深度语音增强技术、基于固定麦克风阵列的多声道深度语音增强技术、以及基于自组织阵列的多声道深度语音增强技术。
展开更多
关键词
深度学习
深度神经网络
语音增强
麦克风阵列
下载PDF
职称材料
分布式网络的多任务扩散算法综述
3
作者
靳丹琦
陈捷
陈景东
《信号处理》
CSCD
北大核心
2023年第11期1901-1918,共18页
在分布式网络中,如何从带噪的实时数据流中估计潜在的模型参数是一个非常重要而极具挑战的问题。应对该问题的一种有效途径是设计扩散算法,通过网络局部信息交换和自组织协同方式来估计网络中所有节点的模型参数。相关方面早期的研究主...
在分布式网络中,如何从带噪的实时数据流中估计潜在的模型参数是一个非常重要而极具挑战的问题。应对该问题的一种有效途径是设计扩散算法,通过网络局部信息交换和自组织协同方式来估计网络中所有节点的模型参数。相关方面早期的研究主要关注的是单任务问题,即所有节点估计同一个模型参数。但实际应用中不同节点往往需要应对不同的估计任务,同时多个待估计的模型参数又可能具备一定的关联性,所以近年来人们将研究重点聚焦到了多任务问题,包括多任务关系建模以及参数优化问题的设计与求解等,并取得了一些重要进展。本文对分布式网络中多任务问题的建模以及当前常用的多任务扩散算法进行简要综述,内容涵盖无监督类型的扩散算法和有监督类型的扩散算法等。具体而言,针对使用无监督方式设计多任务扩散算法,介绍了静态组合矩阵的选取、自适应组合矩阵的设计、两个组合矩阵的组合结构,并简单讨论了三者的适用场景。针对使用有监督方式设计多任务扩散算法,讨论了基于梯度投影法和正则化架构的两种设计方式,并借助文献中的一些典型算法对这些设计方式进行说明。论文侧重于算法原理、算法架构和求解思路等方面的探讨,具体的算法实现细节感兴趣的读者可以参考相应的文献。
展开更多
关键词
分布式参数估计
自适应滤波
扩散算法
多任务
无监督算法
有监督算法
下载PDF
职称材料
用于语音控制的低资源关键词检索系统
被引量:
1
4
作者
徐梦龙
张晓雷
《信号处理》
CSCD
北大核心
2020年第6期879-884,共6页
基于深度神经网络的低资源条件下关键词检索已经取得了很大的进展,但这些方法仍旧需要较多的参数才能保证模型的精度。为了进一步减少模型的参数量,本文将Squeeze-and-Excitation网络和深度可分离卷积应用在关键词检索任务中。首先利用S...
基于深度神经网络的低资源条件下关键词检索已经取得了很大的进展,但这些方法仍旧需要较多的参数才能保证模型的精度。为了进一步减少模型的参数量,本文将Squeeze-and-Excitation网络和深度可分离卷积应用在关键词检索任务中。首先利用Squeeze-and-Excitation网络对不同特征通道之间的相互依赖关系建模的能力进一步提升模型的精度,然后通过将标准卷积替换为深度可分离卷积来有效的减少模型所需要的参数。在谷歌语音命令数据集上的实验证明我们的模型可以在保证高精度的同时把参数量限制在一定的范围内。
展开更多
关键词
关键词检索
Squeeze-and-Excitation网络
深度可分离卷积
下载PDF
职称材料
基于语音分离的人工设计特征、参数化特征和可学习特征的比较
5
作者
朱文博
王谋
+1 位作者
张晓雷
Susanto Rahardja
《中国传媒大学学报(自然科学版)》
2021年第3期52-57,共6页
声学特征可以大致分为三类:人工设计特征,参数化特征和可学习特征。其中,可学习特征是指将其与分离网络以端到端的方式进行联合训练,如时域卷积语音分离网络(convolutional time domain audio separation network,Conv‑Tasnet),这成为...
声学特征可以大致分为三类:人工设计特征,参数化特征和可学习特征。其中,可学习特征是指将其与分离网络以端到端的方式进行联合训练,如时域卷积语音分离网络(convolutional time domain audio separation network,Conv‑Tasnet),这成为了如今语音分离研究中的一种新的趋势。然而在最近的研究中证明了人工设计特征以及参数化特征也能产生具有竞争力的结果。但是,截止目前还没有工作对这三种声学特征进行系统的比较。本文通过设置不同声学特征作为编码器和解码器,在Conv‑Tasnet框架下对它们进行比较。我们还将人工设计的多相位gammatone滤波器组(multi‑phase gammatone filterbank,MPGTF)扩展为一种新的参数化多相位gammatone滤波器组(Parameterized MPGTF,ParaMPGTF)。在WSJ0‑2mix数据集上的实验结果表明:(i)如果解码器是可学习特征时,将编码器设置为STFT,MPGTF,ParaMPGTF以及可学习特征的性能相近;(ii)如果将STFT,MPGTF,ParaMPGTF的逆变换作为解码器时,所提出的ParaMPGTF相比于其他两种人工设计特征有更好的性能。
展开更多
关键词
语音分离
人工设计特征
参数化特征
可学习特征
多相位gammatone滤波器组
下载PDF
职称材料
题名
面向语音通信与交互的麦克风阵列波束形成方法
被引量:
21
1
作者
潘超
黄公平
陈景东
机构
西北工业大学
智能
声学
与
临
境
通信
中心
以色列理工
出处
《信号处理》
CSCD
北大核心
2020年第6期804-815,共12页
基金
重点研发计划项目(2018AAA0102200)
自然科学基金重点项目(61831019)
+1 种基金
自然科学基金青年项目(61901318)
中以合作项目(61761146001)等的资助.
文摘
临境语音通信与智能语音交互都面临复杂声学环境中的远距离高保真拾音难题,解决这一难题的有效途径是使用由多个麦克风传感器组成的麦克风阵列或多通道拾音系统,这种系统的核心是信号处理,通过对空间采样的声场信息进行时、空、频三域的联合处理来实现声源定向/定位、信号增强、噪声抑制、混响抑制、声源分离、声场参数估计等功能。麦克风阵列信号处理的方法有很多,其中研究的最多、使用得最广的方法是波束形成。本文对麦克风阵列波束形成的原理、进展以及当前常用的方法进行简要综述,内容涵盖延迟求和、超指向、差分、正交级数展开、Kronecker和自适应波束形成方法。论文侧重于方法原理、机理和架构方面的探讨,具体的算法实现细节感兴趣的读者可以参考相应的文献。
关键词
麦克风阵列
频不变波束形成
超指向波束形成
差分波束形成
Kronecker波束形成
自适应波束形成
Keywords
microphone array
frequency-invariant beamforming
superdirective beamforming
differential beamforming
Kronecker beamforming
adaptive beamforming
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于深度学习的语音增强简述
被引量:
6
2
作者
张晓雷
机构
西北工业大学
智能
声学
与
临
境
通信
研究
中心
西北工业大学
航海学院
出处
《网络新媒体技术》
2019年第2期1-8,共8页
基金
国家自然科学基金(编号:61671381)
文摘
语音增强是一种将语音从干扰声中增强出来的技术。它是语音信号处理的核心研究内容之一。近年来,深度学习在语音增强中的成功应用推动了该技术的快速发展。本文将简要回顾基于深度学习的语音增强技术。首先回顾语音增强中所采用的深度学习算法和优化目标,在此基础上,将进一步回顾具有代表性的单声道深度语音增强技术、基于固定麦克风阵列的多声道深度语音增强技术、以及基于自组织阵列的多声道深度语音增强技术。
关键词
深度学习
深度神经网络
语音增强
麦克风阵列
Keywords
Deep learning
Deep neural networks
Speech enhancement
Microphone arrays
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN912.35 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
分布式网络的多任务扩散算法综述
3
作者
靳丹琦
陈捷
陈景东
机构
武汉
大学
电子信息学院
西北工业大学
航海学院
智能
声学
与
临
境
通信
研究
中心
出处
《信号处理》
CSCD
北大核心
2023年第11期1901-1918,共18页
基金
自然科学基金重大项目(62192710)及其课题(62192713)
自然科学基金面上项目(62171380)
+2 种基金
陕西省科技计划重点产业创新链(群)(2022ZDLGY01-02)
西安市科技产业化计划(XA2020-RGZNTJ-0076)
武汉大学“卓越博士后”计划等的资助。
文摘
在分布式网络中,如何从带噪的实时数据流中估计潜在的模型参数是一个非常重要而极具挑战的问题。应对该问题的一种有效途径是设计扩散算法,通过网络局部信息交换和自组织协同方式来估计网络中所有节点的模型参数。相关方面早期的研究主要关注的是单任务问题,即所有节点估计同一个模型参数。但实际应用中不同节点往往需要应对不同的估计任务,同时多个待估计的模型参数又可能具备一定的关联性,所以近年来人们将研究重点聚焦到了多任务问题,包括多任务关系建模以及参数优化问题的设计与求解等,并取得了一些重要进展。本文对分布式网络中多任务问题的建模以及当前常用的多任务扩散算法进行简要综述,内容涵盖无监督类型的扩散算法和有监督类型的扩散算法等。具体而言,针对使用无监督方式设计多任务扩散算法,介绍了静态组合矩阵的选取、自适应组合矩阵的设计、两个组合矩阵的组合结构,并简单讨论了三者的适用场景。针对使用有监督方式设计多任务扩散算法,讨论了基于梯度投影法和正则化架构的两种设计方式,并借助文献中的一些典型算法对这些设计方式进行说明。论文侧重于算法原理、算法架构和求解思路等方面的探讨,具体的算法实现细节感兴趣的读者可以参考相应的文献。
关键词
分布式参数估计
自适应滤波
扩散算法
多任务
无监督算法
有监督算法
Keywords
parameter estimation
adaptive filtering
diffusion strategy
multitask
unsupervised learning
supervised learning
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
用于语音控制的低资源关键词检索系统
被引量:
1
4
作者
徐梦龙
张晓雷
机构
西北工业大学
航海学院
智能
声学
与
临
境
通信
研究
中心
出处
《信号处理》
CSCD
北大核心
2020年第6期879-884,共6页
基金
科技部国家重点研发计划重大项目(2018AAA0102200)
国家自然科学基金(61831019,61671381)。
文摘
基于深度神经网络的低资源条件下关键词检索已经取得了很大的进展,但这些方法仍旧需要较多的参数才能保证模型的精度。为了进一步减少模型的参数量,本文将Squeeze-and-Excitation网络和深度可分离卷积应用在关键词检索任务中。首先利用Squeeze-and-Excitation网络对不同特征通道之间的相互依赖关系建模的能力进一步提升模型的精度,然后通过将标准卷积替换为深度可分离卷积来有效的减少模型所需要的参数。在谷歌语音命令数据集上的实验证明我们的模型可以在保证高精度的同时把参数量限制在一定的范围内。
关键词
关键词检索
Squeeze-and-Excitation网络
深度可分离卷积
Keywords
keyword spotting
Squeeze-and-Excitation network
depthwise separable convolution
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN912.3 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
基于语音分离的人工设计特征、参数化特征和可学习特征的比较
5
作者
朱文博
王谋
张晓雷
Susanto Rahardja
机构
西北工业大学
航海学院
智能
声学
与
临
境
通信
研究
中心
出处
《中国传媒大学学报(自然科学版)》
2021年第3期52-57,共6页
文摘
声学特征可以大致分为三类:人工设计特征,参数化特征和可学习特征。其中,可学习特征是指将其与分离网络以端到端的方式进行联合训练,如时域卷积语音分离网络(convolutional time domain audio separation network,Conv‑Tasnet),这成为了如今语音分离研究中的一种新的趋势。然而在最近的研究中证明了人工设计特征以及参数化特征也能产生具有竞争力的结果。但是,截止目前还没有工作对这三种声学特征进行系统的比较。本文通过设置不同声学特征作为编码器和解码器,在Conv‑Tasnet框架下对它们进行比较。我们还将人工设计的多相位gammatone滤波器组(multi‑phase gammatone filterbank,MPGTF)扩展为一种新的参数化多相位gammatone滤波器组(Parameterized MPGTF,ParaMPGTF)。在WSJ0‑2mix数据集上的实验结果表明:(i)如果解码器是可学习特征时,将编码器设置为STFT,MPGTF,ParaMPGTF以及可学习特征的性能相近;(ii)如果将STFT,MPGTF,ParaMPGTF的逆变换作为解码器时,所提出的ParaMPGTF相比于其他两种人工设计特征有更好的性能。
关键词
语音分离
人工设计特征
参数化特征
可学习特征
多相位gammatone滤波器组
Keywords
speech separation
handcrafted features
learnable features
parameterized features
multi-phase gammatone filterbank
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向语音通信与交互的麦克风阵列波束形成方法
潘超
黄公平
陈景东
《信号处理》
CSCD
北大核心
2020
21
下载PDF
职称材料
2
基于深度学习的语音增强简述
张晓雷
《网络新媒体技术》
2019
6
下载PDF
职称材料
3
分布式网络的多任务扩散算法综述
靳丹琦
陈捷
陈景东
《信号处理》
CSCD
北大核心
2023
0
下载PDF
职称材料
4
用于语音控制的低资源关键词检索系统
徐梦龙
张晓雷
《信号处理》
CSCD
北大核心
2020
1
下载PDF
职称材料
5
基于语音分离的人工设计特征、参数化特征和可学习特征的比较
朱文博
王谋
张晓雷
Susanto Rahardja
《中国传媒大学学报(自然科学版)》
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部