期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
深度复数轴向自注意力卷积循环网络的语音增强 被引量:1
1
作者 曹洁 王乔 +3 位作者 梁浩鹏 王宸章 李晓旭 于泓 《计算机系统应用》 2024年第4期60-68,共9页
单通道语音增强任务中相位估计不准确会导致增强语音的质量较差,针对这一问题,提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network,DCACRN)的语音增强方法,在复数域... 单通道语音增强任务中相位估计不准确会导致增强语音的质量较差,针对这一问题,提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network,DCACRN)的语音增强方法,在复数域同时实现了语音幅度信息和相位信息的增强.首先使用基于复数卷积网络的编码器从输入语音信号中提取复数表示的特征,并引入卷积跳连模块用以将特征映射到高维空间进行特征融合,加强信息间的交互和梯度的流动.然后设计了基于轴向自注意力机制的编码器-解码器结构,利用轴向自注意力机制来增强模型的时序建模能力和特征提取能力.最后通过解码器实现对语音信号的重构,同时利用混合损失函数优化网络模型,提升增强语音信号的质量.实验在公开数据集Valentini和DNS Challenge上进行,结果表明所提方法相对于其他模型在客观语音质量评估(perceptual evaluation of speech quality,PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两项指标上均有提升,在非混响数据集中,PESQ比DCTCRN(deep cosine transform convolutional recurrent network)提高了12.8%,比DCCRN(deep complex convolutional recurrent network)提高了3.9%,验证了该网络模型在语音增强任务中的有效性. 展开更多
关键词 单通道语音增强 复数卷积循环网络 卷积跳连 轴向自注意力机制
下载PDF
Single-Channel Speech Enhancement Using Critical-Band Rate Scale Based Improved Multi-Band Spectral Subtraction 被引量:1
2
作者 Navneet Upadhyay Abhijit Karmakar 《Journal of Signal and Information Processing》 2013年第3期314-326,共13页
This paper addresses the problem of single-channel speech enhancement in the adverse environment. The critical-band rate scale based on improved multi-band spectral subtraction is investigated in this study for enhanc... This paper addresses the problem of single-channel speech enhancement in the adverse environment. The critical-band rate scale based on improved multi-band spectral subtraction is investigated in this study for enhancement of single-channel speech. In this work, the whole speech spectrum is divided into different non-uniformly spaced frequency bands in accordance with the critical-band rate scale of the psycho-acoustic model and the spectral over-subtraction is carried-out separately in each band. In addition, for the estimation of the noise from each band, the adaptive noise estimation approach is used and does not require explicit speech silence detection. The noise is estimated and updated by adaptively smoothing the noisy signal power in each band. The smoothing parameter is controlled by a-posteriori signal-to-noise ratio (SNR). For the performance analysis of the proposed algorithm, the objective measures, such as, SNR, segmental SNR, and perceptual evaluations of the speech quality are conducted for the variety of noises at different levels of SNRs. The speech spectrogram and objective evaluations of the proposed algorithm are compared with other standard speech enhancement algorithms and proved that the musical structure of the remnant noise and background noise is better suppressed by the proposed algorithm. 展开更多
关键词 single-channel speech enhancement Critical-Band RATE SCALE Spectral Over-Subtraction Adaptive Noise Estimation Objective Measure speech Spectrograms
下载PDF
改进最大信噪比的独立成分分析单通道语音增强算法 被引量:3
3
作者 贾海蓉 张雪英 贾丽红 《北京理工大学学报》 EI CAS CSCD 北大核心 2013年第2期198-202,共5页
针对现有基于独立成分分析(ICA)的盲源分离算法在单通道语音增强中的不稳定性和信噪比低的问题,提出了新的基于最大信噪比的ICA语音增强算法.该算法首先用带噪语音直接乘以二维向量,并经过列满秩的转换,得到既具有源信号特性、又不会引... 针对现有基于独立成分分析(ICA)的盲源分离算法在单通道语音增强中的不稳定性和信噪比低的问题,提出了新的基于最大信噪比的ICA语音增强算法.该算法首先用带噪语音直接乘以二维向量,并经过列满秩的转换,得到既具有源信号特性、又不会引入新噪声的二路观测信号,保证了系统的稳定性;再结合用小波系数改进的最大信噪比的ICA算法来实现,为增强的效果和提高信噪比提供了依据.实验结果分析表明,该算法是稳定的,且能有效地提高信噪比的值. 展开更多
关键词 独立成分分析 单通道 小波系数 二路观测信号 语音增强
下载PDF
基于字典学习和稀疏表示的单通道语音增强算法综述 被引量:2
4
作者 叶中付 朱媛媛 贾翔宇 《应用声学》 CSCD 北大核心 2019年第4期645-652,共8页
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规... 如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对 4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。 展开更多
关键词 单通道语音增强 稀疏表示 字典学习
下载PDF
改进NMF单通道语音增强算法 被引量:1
5
作者 张星 《机械设计与制造》 北大核心 2019年第1期268-271,共4页
针对语音与噪声在频带内存在高度重叠而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率... 针对语音与噪声在频带内存在高度重叠而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率进行估计,以此对NMF识别基进行自适应补偿,从而提高识别基语音增强性能,然后通过残差消除进一步提高语音质量,实验结果表明,与传统的基于单通道的NMF方法相比,文中算法获得了更好的语音增强性能。 展开更多
关键词 单通道语音增强 语音存在概率 非负矩阵分解 对数谱估计 无监督学习
下载PDF
基于强约束字典联合深度神经网络的单通道语音分离 被引量:1
6
作者 孙林慧 袁硕 +2 位作者 张蒙 梁文清 步云怡 《南京邮电大学学报(自然科学版)》 北大核心 2023年第2期1-10,共10页
针对基于字典学习语音分离方法的“交叉投影”问题,提出了强约束的优化函数,不仅抑制重构信号和目标信号的误差,约束干净信号在联合字典上的误差,而且抑制干净信号在其他字典上的投影并限制字典间的原子相关性。此外,为了进一步提高两... 针对基于字典学习语音分离方法的“交叉投影”问题,提出了强约束的优化函数,不仅抑制重构信号和目标信号的误差,约束干净信号在联合字典上的误差,而且抑制干净信号在其他字典上的投影并限制字典间的原子相关性。此外,为了进一步提高两个相似信号的分离效果,提出基于强约束字典联合深度神经网络的单通道语音分离方法,首先利用强约束字典实现目标与干扰语音的初步分离,然后通过联合约束利用深度神经网络实现语音与干扰语音交叉投影残余的分离。实验结果表明,与其他优秀单通道语音分离方法相比,该算法有效提升了语音分离系统的性能。 展开更多
关键词 单通道语音分离 字典学习 深度神经网络 损失函数 语音增强
下载PDF
基于多维注意力机制的单通道语音增强方法 被引量:1
7
作者 姚瑶 杨吉斌 +2 位作者 张雄伟 陈乐乐 范君怡 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期669-679,共11页
基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将... 基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将通道注意力和全局、局部时间注意力进行级联,充分挖掘深度神经网络各通道间语音特征的长短时相关性.在此基础上,设计了基于多维注意力机制的时域语音增强网络MDAM-Net,采用跳跃连接的编解码结构获取深层语音特征,并采用MDAM充分关注干净语音特征在网络通道间、时间方向上全局与局部范围的变化差异,可以更好地建模语音特征的上下文联系.仿真实验的结果表明,在保持较低模型参数量条件下,MDAM-Net在VoiceBank-DEMAND公开数据集上增强语音的PESQ(Perceptual Evaluation of Speech Quality)评分可以达到3.25.在低信噪比条件下,增强语音质量显著优于已有的单通道语音增强模型. 展开更多
关键词 单通道语音增强 多维注意力 通道注意力 TRANSFORMER
下载PDF
一种基于谱减法的语音增强算法研究 被引量:3
8
作者 刘雅琴 甘文丽 《微型电脑应用》 2020年第12期56-57,64,共3页
为了从带噪语音信号中提取出纯净的原始语音,分析了基本谱减法,给出了功率谱的谱减法的完整步骤,在此基础上引入噪声谱估计系数a,减少了功率谱估计的误差。在Matlab平台上对信噪比分别为5 dB、0 dB、-5 dB、-10 dB四种带噪语音信号进行... 为了从带噪语音信号中提取出纯净的原始语音,分析了基本谱减法,给出了功率谱的谱减法的完整步骤,在此基础上引入噪声谱估计系数a,减少了功率谱估计的误差。在Matlab平台上对信噪比分别为5 dB、0 dB、-5 dB、-10 dB四种带噪语音信号进行了仿真验证,提高的信噪比依次约为6、8、10和11,结果表明输入信噪比越低,增强后的信噪比提高越多,该算法对于低信噪比的语音信号增强有一定的效果。 展开更多
关键词 单通道 语音增强 谱减法 信噪比 离散傅里叶变换
下载PDF
面向舱室声学环境的深度时域语音增强网络 被引量:1
9
作者 张琳 王海涛 +2 位作者 杨爽 曾向阳 陈克安 《声学学报》 EI CAS CSCD 北大核心 2023年第4期890-900,共11页
针对舱室环境单通道语音增强问题,设计了一种联合并行空洞卷积与分组卷积的深度时域语音增强网络。该网络以经典卷积时域音频分离网络为基础,在增强层设计中通过不同膨胀因子执行两路并行的空洞卷积操作,实现对长时信号的处理以更多地... 针对舱室环境单通道语音增强问题,设计了一种联合并行空洞卷积与分组卷积的深度时域语音增强网络。该网络以经典卷积时域音频分离网络为基础,在增强层设计中通过不同膨胀因子执行两路并行的空洞卷积操作,实现对长时信号的处理以更多地提取信号包络所包含的低频信息并抑制噪声混响所带来的时延问题,同时保留了局部的语音细节信息,提高对波形中所包含语音及背景噪声谐波信息的提取准确度;另外,利用分组卷积降低并行卷积操作所导致的网络规模扩大,使网络在具有良好增强效果的同时能够保持较小的网络规模及运算复杂度。以多类飞机舱室噪声为数据基础的实验表明,所设计的网络模块相较于基线网络提升了客观评价指标值,与现有其他常用网络的比较结果表明此方法在舱室环境的数据条件下可获得更好的主客观语音增强评价指标,且在高噪声级的线谱及窄带处具有更低的失真度。 展开更多
关键词 舱室环境 单通道语音增强 深度网络 并行空洞卷积 分组卷积
下载PDF
单通道语音增强技术的研究现状与发展趋势 被引量:1
10
作者 许春冬 徐琅 +1 位作者 周滨 凌贤鹏 《江西理工大学学报》 CAS 2020年第5期55-64,共10页
语音增强技术在语音信号处理领域得到了充分重视和广泛研究,其目的是降低噪声对语音信号的影响,提升目标语音信号的质量。文章首先分析了语音增强基本模型、噪声类型以及语音质量评价方法,其次详细介绍了几种传统的语音增强方法以及监... 语音增强技术在语音信号处理领域得到了充分重视和广泛研究,其目的是降低噪声对语音信号的影响,提升目标语音信号的质量。文章首先分析了语音增强基本模型、噪声类型以及语音质量评价方法,其次详细介绍了几种传统的语音增强方法以及监督性单通道语音增强方法。重点介绍了几种代表性的基于深度神经网络的语音增强方法,包括基于DNN、CNN、RNN、LSTM、GAN等网络的语音增强方法。最后总结了几种常用语音增强方法的优缺点,并根据深度学习和语音处理的发展现状,分析了语音增强技术所面临的挑战和发展趋势。 展开更多
关键词 单通道 语音增强 深度神经网络 机器学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部