期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
基于YOLO V3框架改进的目标检测 被引量:17
1
作者 周志锋 万旺根 王旭智 《电子测量技术》 2020年第18期102-106,共5页
近年来,目标检测技术成为计算机视觉一个重要的任务,应用非常广泛。但是对于小目标的检测精度和效率都不是很高,为此,在传统的YoLo V3框架上进行了改进,提出了一种结合通道增强的方法。主要工作集中在网络模型的修改及训练过程的一些优... 近年来,目标检测技术成为计算机视觉一个重要的任务,应用非常广泛。但是对于小目标的检测精度和效率都不是很高,为此,在传统的YoLo V3框架上进行了改进,提出了一种结合通道增强的方法。主要工作集中在网络模型的修改及训练过程的一些优化,提出了改进版本的YoLo V3网络。对比了采用预训练权重的方法与未采用从无到有的训练模式,经过验证在VOC2007数据集上准确率提升了0.2%,召回率提升了0.2%。 展开更多
关键词 目标检测 通道增强 FPN 卷积神经网络
下载PDF
基于像素级水平的通道自适应水下图像增强算法
2
作者 彭晏飞 张添淇 安彤 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1037-1045,共9页
现有基于深度学习的算法采用编解码方式在高维特征中对水下图像进行增强,没有考虑水下图像的通道差异性退化特点,导致增强效果普遍较差。针对这一问题,提出了一种基于像素级水平的通道自适应水下图像增强算法,将水下图像在像素级分R、G... 现有基于深度学习的算法采用编解码方式在高维特征中对水下图像进行增强,没有考虑水下图像的通道差异性退化特点,导致增强效果普遍较差。针对这一问题,提出了一种基于像素级水平的通道自适应水下图像增强算法,将水下图像在像素级分R、G和B三通道进行增强。此算法分4个阶段,通过4个阶段的分通道特征提取完成整个增强过程。首先,通过增强网络的局部和全局语义,优化通道衰减来修复上下文的颜色通道;其次,通过注意机制聚合空间和通道特征,并抑制不相关的颜色定位跳跃信息;然后,通过优化注意力机制调整自适应特征;最后,为提高算法色偏纠正能力,提出了一个色偏纠正模块,在第四阶段使用色偏调节模块进一步调整图像的色偏问题。在UIEB数据集和EUVP数据集上与其他算法进行对比,本文算法的PSNR指标提高了14.35%,SSIM提高了5.8%,UIQM提高了3.2%,UCIQE提高了13.7%,且主观效果最佳。 展开更多
关键词 水下图像增强 通道增强 像素级增强 深度学习
下载PDF
基于脑电通道增强的情绪识别方法 被引量:5
3
作者 王晨 胡景钊 +4 位作者 刘科 王洁琼 郑佳宾 吴东亚 冯筠 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期560-570,共11页
随着人工智能与深度学习的发展,基于深度学习的多通道脑电信号的情绪识别研究逐渐受到关注,但多通道脑电情绪识别信号复杂且各通道重要性一致,并不能高效且有针对性地进行脑电情绪识别。为此,该文提出一种基于缩放卷积层和脑电通道增强... 随着人工智能与深度学习的发展,基于深度学习的多通道脑电信号的情绪识别研究逐渐受到关注,但多通道脑电情绪识别信号复杂且各通道重要性一致,并不能高效且有针对性地进行脑电情绪识别。为此,该文提出一种基于缩放卷积层和脑电通道增强模块的情绪识别方法,能直接在脑电物理通道上进行增强学习。首先,通过缩放卷积层提取多通道脑电情绪信号的类时频特征;然后,通过脑电通道增强模块对所有脑电物理通道重新赋予不同的重要性;最后,利用卷积神经网络对情绪进行分类。该方法能够融合多通道脑电信号的时间和频率信息,同时,通过输出各脑电通道的重要性,探究不同情绪维度与脑电通道之间的关系。在DEAP数据集上进行了实验验证,不同脑电通道对情绪识别任务的重要性存在差异,其中,额叶区和枕叶区的C4、P4、P3、PO4、F75个脑电通道重要性相对较高,该情绪识别方法在愉悦度、唤醒度和支配度3个情绪维度上的识别准确率也均有提升。 展开更多
关键词 情绪识别 脑电信号 通道增强 缩放卷积 深度学习
下载PDF
多模态交互平衡下的健康一体机适老设计研究 被引量:2
4
作者 张萍 喻露 沈朝群 《设计艺术研究》 2022年第4期61-66,共6页
基于多模态交互平衡机制,研究健康一体机的适老化需求并提供创新性的设计解决方案。基于VACP理论构建了多模态交互平衡机制干预下的适老化设计方法流程,通过对老年用户的通道特征及健康一体机操作任务分析,获取健康一体机不同操作界面... 基于多模态交互平衡机制,研究健康一体机的适老化需求并提供创新性的设计解决方案。基于VACP理论构建了多模态交互平衡机制干预下的适老化设计方法流程,通过对老年用户的通道特征及健康一体机操作任务分析,获取健康一体机不同操作界面的用户VACP通道资源量化需求,结合通道代偿和通道增强理论,针对用户VACP通道资源量化需求,提出具体的适老化设计策略并指导完成设计实践。初步验证了基于VACP理论的多模态交互平衡机制对于适老化产品设计研究的有效性。 展开更多
关键词 多模态交互平衡机制 VACP理论 健康一体机 通道代偿 通道增强 适老化
下载PDF
改进SSD的触摸屏银浆线路缺陷检测研究
5
作者 郭前进 吴飞斌 +2 位作者 孙园 龙玥 韩军 《计算机与数字工程》 2023年第11期2713-2718,2757,共7页
为加强对触摸屏面板的质量把关,改善触摸屏面板制造工艺,推动自动化生产进程。提出了一种改进SSD的触摸屏银浆线路缺陷检测方法,该方法利用多次卷积、下采样等方式提取不同尺度下的图像特征;利用不同尺度的图像特征进行特征融合,实现特... 为加强对触摸屏面板的质量把关,改善触摸屏面板制造工艺,推动自动化生产进程。提出了一种改进SSD的触摸屏银浆线路缺陷检测方法,该方法利用多次卷积、下采样等方式提取不同尺度下的图像特征;利用不同尺度的图像特征进行特征融合,实现特征叠加效果;将融合后的特征通过通道注意力机制增强不同维度特征的语义信息;利用改进后的特征进行回归实现触摸屏银浆线路检测。实验证明,所提方法对于触摸屏银浆线路微小缺陷具有检测速度快,准确度高的良好效果,可满足工业需求。 展开更多
关键词 SSD算法 通道增强 特征融合 缺陷检测
下载PDF
云计算无线接入网下的物理下行控制信道增强
6
作者 杜宁 《通信电源技术》 2022年第13期132-134,共3页
为解决传统长期演进(Long Trem Evolution,LTE)无线接入网存在的协调不充分、难于实现等缺陷,针对物理下行控制信道增强可行性进行科学分析,提出针对物理下行控制信道的有效增强方案,包括资源预留、联合发射、跨载波调度等,以进一步增... 为解决传统长期演进(Long Trem Evolution,LTE)无线接入网存在的协调不充分、难于实现等缺陷,针对物理下行控制信道增强可行性进行科学分析,提出针对物理下行控制信道的有效增强方案,包括资源预留、联合发射、跨载波调度等,以进一步增强物理下行控制信道,解决传统LTE无线接入网自身存在的种种缺陷,为该领域科研人员提供有益理论及实践指导。 展开更多
关键词 云计算 长期演进(LTE) 无线接入网 信道增强 物理下行控制
下载PDF
一种结构化双注意力混合通道增强的跨模态行人重识别方法 被引量:1
7
作者 庄建军 庄宇辰 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期518-526,共9页
在目前跨模态行人重识别技术的研究中,大部分现有的方法会通过单模态原始可见光图像或者对抗生成图像的局部共享特征来降低跨模态差异,导致在红外图像判别中由于底层特征信息丢失而缺乏稳定的识别准确率。为了解决该问题,该文提出一种... 在目前跨模态行人重识别技术的研究中,大部分现有的方法会通过单模态原始可见光图像或者对抗生成图像的局部共享特征来降低跨模态差异,导致在红外图像判别中由于底层特征信息丢失而缺乏稳定的识别准确率。为了解决该问题,该文提出一种结构化双注意力可交换混合随机通道增强的特征融合跨模态行人重识别方法,利用通道增强后的可视图像作为第三模态,通过图像通道可交换随机混合增强(I-CSA)模块对可见光图像进行单通道和三通道随机混合增强抽取,从而突出行人的姿态结构细节,在学习中减少模态间差异。结构化联合注意力特征融合(SAFF)模块在注重模态间行人姿态结构关系的前提下,为跨模态表征学习提供更丰富的监督,增强了模态变化中共享特征的鲁棒性。在SYSU-MM01数据集全搜索模式单摄设置下Rank-1和mAP分别达到71.2%和68.1%,优于同类前沿方法。 展开更多
关键词 行人重识别 跨模态 混合通道增强 联合注意力 特征融合
下载PDF
双通道局部处理的自适应图像增强方法 被引量:3
8
作者 窦智 韩玉兵 +1 位作者 盛卫星 马晓峰 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第10期1823-1831,共9页
为了在无需人工干预的情况下自适应地处理多种不同特征的降质图像,有效恢复图中的细节信息,提出一种双通道局部处理的图像增强方法.首先在HSV色彩空间内分别在亮、暗双通道对亮度分量进行局部分析,计算出与之相适应的增强函数,对图像进... 为了在无需人工干预的情况下自适应地处理多种不同特征的降质图像,有效恢复图中的细节信息,提出一种双通道局部处理的图像增强方法.首先在HSV色彩空间内分别在亮、暗双通道对亮度分量进行局部分析,计算出与之相适应的增强函数,对图像进行增强;然后对双通道的增强结果进行混合高斯加权合并,得到增强后的亮度分量;最后分析增强前后亮度分布的差异,计算色彩补偿函数,矫正增强过程中引入的色彩失真.此外,还提出一种快速滑窗技术,以有效地降低运算的时间复杂度.实验结果表明,该方法能够灵活地处理如曝光不足、曝光过度、逆光以及雾霾影响等不同种类的图像,甚至是综合了以上多种特性的复杂图像,在处理效果和自适应能力上优势明显. 展开更多
关键词 图像处理 对比度增强 局部处理 快速滑窗 多通道增强
下载PDF
改进U-Net深度网络的视网膜血管分割算法 被引量:2
9
作者 曲小波 余粟 《中国医学物理学杂志》 CSCD 2023年第10期1212-1219,共8页
为了解决U-Net算法在分割眼底图像时无法分割末梢微小血管和无法处理噪声干扰等问题,提出了一种改进的视网膜血管分割算法。首先,在U-Net算法中引入通道强化残差网络,用以优化U-Net架构,使得网络识别更多视网膜微血管。其次,引入空间注... 为了解决U-Net算法在分割眼底图像时无法分割末梢微小血管和无法处理噪声干扰等问题,提出了一种改进的视网膜血管分割算法。首先,在U-Net算法中引入通道强化残差网络,用以优化U-Net架构,使得网络识别更多视网膜微血管。其次,引入空间注意力网络来排除噪声,更好地突出血管。最后,在损失函数的计算中,使用动态权重代替U-Net算法的固定权重,迫使神经网络能够学习一个稳健的特征映射。将改进的算法在DRIVE数据集上进行实验,实验结果表明本文分割算法的准确性和敏感性大幅提高。比原U-Net算法准确性和敏感性分别提高了2.12%和7.51%,比DCU-Net准确性和敏感性分别提高了1.20%和2.55%。 展开更多
关键词 医疗图像分割 深度学习 通道强化残差网络 空间注意力网络 动态损失函数
下载PDF
基于多通道增强融合的自适应液晶屏图像分割 被引量:2
10
作者 邵晓琦 徐海燕 +1 位作者 侯一兴 张学武 《电子测量与仪器学报》 CSCD 北大核心 2020年第12期76-84,共9页
液晶屏电子仪表因其示数精确,抗干扰能力强的特性,逐渐取代了指针式仪表,在工业生产中得到了广泛的应用。针对液晶屏的自身的显示特性和显示原理,提出一种利用信息熵进行自适应彩色形态学预处理且基于HSV空间和色调映射V通道增强液晶屏... 液晶屏电子仪表因其示数精确,抗干扰能力强的特性,逐渐取代了指针式仪表,在工业生产中得到了广泛的应用。针对液晶屏的自身的显示特性和显示原理,提出一种利用信息熵进行自适应彩色形态学预处理且基于HSV空间和色调映射V通道增强液晶屏区域分割方法,并结合了双通道图像加权融合的区域图像增强算法研究,实现液晶屏位置区域的分割。对多种液晶屏图像的分割实验的结果表明,较之传统液晶屏分割方案,该方法对单色液晶屏的分割准确度提升8.6%,对彩色液晶屏分割准确度提升了12.4%。 展开更多
关键词 液晶屏 信息熵 彩色形态学 图像增强 多通道增强融合
下载PDF
深度复数轴向自注意力卷积循环网络的语音增强 被引量:1
11
作者 曹洁 王乔 +3 位作者 梁浩鹏 王宸章 李晓旭 于泓 《计算机系统应用》 2024年第4期60-68,共9页
单通道语音增强任务中相位估计不准确会导致增强语音的质量较差,针对这一问题,提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network,DCACRN)的语音增强方法,在复数域... 单通道语音增强任务中相位估计不准确会导致增强语音的质量较差,针对这一问题,提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network,DCACRN)的语音增强方法,在复数域同时实现了语音幅度信息和相位信息的增强.首先使用基于复数卷积网络的编码器从输入语音信号中提取复数表示的特征,并引入卷积跳连模块用以将特征映射到高维空间进行特征融合,加强信息间的交互和梯度的流动.然后设计了基于轴向自注意力机制的编码器-解码器结构,利用轴向自注意力机制来增强模型的时序建模能力和特征提取能力.最后通过解码器实现对语音信号的重构,同时利用混合损失函数优化网络模型,提升增强语音信号的质量.实验在公开数据集Valentini和DNS Challenge上进行,结果表明所提方法相对于其他模型在客观语音质量评估(perceptual evaluation of speech quality,PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两项指标上均有提升,在非混响数据集中,PESQ比DCTCRN(deep cosine transform convolutional recurrent network)提高了12.8%,比DCCRN(deep complex convolutional recurrent network)提高了3.9%,验证了该网络模型在语音增强任务中的有效性. 展开更多
关键词 单通道语音增强 复数卷积循环网络 卷积跳连 轴向自注意力机制
下载PDF
电力设备缺陷文本的双通道语义增强网络挖掘方法 被引量:1
12
作者 张宇波 王有元 +1 位作者 梁玄鸿 夏宇 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期1923-1932,共10页
电力设备运维环节积累的缺陷文本可指导设备的状态评价和检修工作。然而缺陷文本结构多样且背景噪声强,导致智能挖掘信息的难度大。针对该问题,提出了基于双通道语义增强网络的电力设备缺陷文本挖掘方法。首先,分析缺陷文本的内容,结合... 电力设备运维环节积累的缺陷文本可指导设备的状态评价和检修工作。然而缺陷文本结构多样且背景噪声强,导致智能挖掘信息的难度大。针对该问题,提出了基于双通道语义增强网络的电力设备缺陷文本挖掘方法。首先,分析缺陷文本的内容,结合自然语言处理方法预处理缺陷文本。利用Glove词向量嵌入模型将缺陷文本映射至数值空间表征语义。然后,基于词移距离构建缺陷文本的增强文本,通过含注意力机制的双向长短时记忆神经网络分别提取缺陷文本和增强文本的特征,进而在网络末端融合特征实现关键信息加强,提升模型分类性能。实例表明,所提双通道语义增强网络的分类Macro-F1指标相比于传统机器学习方法、单通道深度学习方法至少提高6.2%、5.2%,同时所提方法为实现图像、文本等多源运维数据的特征增强提供新思路。 展开更多
关键词 缺陷文本 信息智能挖掘 词移距离 双通道语义增强网络 特征融合
下载PDF
采用级联策略融合边界特征的多尺度息肉分割网络
13
作者 易见兵 万建辉 +2 位作者 曹锋 李俊 陈鑫 《光学精密工程》 EI CAS CSCD 北大核心 2024年第18期2846-2860,共15页
结直肠息肉分割能有效辅助医生筛查大肠腺瘤,但息肉分割存在噪声较多、边界区分度不够等问题。针对以上问题,本文设计了一种采用级联策略融合边界特征的多尺度息肉分割网络。首先,本文提出了一种改进的通道分组空间增强模块,以增强骨干... 结直肠息肉分割能有效辅助医生筛查大肠腺瘤,但息肉分割存在噪声较多、边界区分度不够等问题。针对以上问题,本文设计了一种采用级联策略融合边界特征的多尺度息肉分割网络。首先,本文提出了一种改进的通道分组空间增强模块,以增强骨干网络提取的图像特征,从而提高通道和空间位置的相关性。其次,考虑到边界区分度不够,设计了一个级联特征融合网络,以更好地保留边界信息并提高边界区分度,从而提高分割精度。最后,引入了一种双分支混合上采样模块来获取更多的特征细节信息,以实现特征的互补以及捕获更完整有效的特征。在CVC-ClinicDB和Kvasir数据集上进行测试,本文算法的平均Dice系数分别为0.944,0.920,平均交并比分别为0.900,0.869;而M2SNet算法的平均Dice系数分别为0.922,0.912,平均交并比分别为0.880,0.861。在ETIS-LaribPolypDB,CVC-300和CVC-ColonDB数据集上进行测试,本文算法的平均Dice系数分别为0.776,0.915,0.782;而M2SNet算法的平均Dice系数分别为0.749,0.903,0.758。实验结果表明本文算法的分割精度较高,泛化能力较强。 展开更多
关键词 多尺度息肉分割 通道分组空间增强 边界特征增强 级联特征融合 双分支上采样
下载PDF
应用于助听器的频域双通道语声增强算法
14
作者 陈新漪 原建平 +1 位作者 崔杰 理华 《应用声学》 CSCD 北大核心 2024年第4期880-891,共12页
在助听器的日常使用环境中,干扰噪声与期望语声往往来自不同的方向,因此将多通道语声增强技术应用于数字助听器可以有效地降低干扰噪声的影响。自适应的多通道语声增强技术可以在复杂环境中实现指向模式的动态调整,提高助听器的消噪性... 在助听器的日常使用环境中,干扰噪声与期望语声往往来自不同的方向,因此将多通道语声增强技术应用于数字助听器可以有效地降低干扰噪声的影响。自适应的多通道语声增强技术可以在复杂环境中实现指向模式的动态调整,提高助听器的消噪性能。该文设计了一种基于频域广义旁瓣抵消的双通道语声增强系统,利用噪声参考信号与语声参考信号在频域的相关性对系统阻塞矩阵以及传统自适应部分进行改进,防止阻塞矩阵产生较大的语声泄露,且在语声段选择较小的步长而在噪声段选择较大的步长进行自适应权系数更新,保留期望语声同时抑制干扰噪声。仿真实验中,利用多种干扰环境中的两种客观评价指标验证了所提算法的有效性。 展开更多
关键词 助听器 双通道语声增强 广义旁瓣抵消 自适应滤波 相关性
下载PDF
基于跨通道特征增强图卷积网络的骨架行为识别
15
作者 吴志泽 陈盛 +2 位作者 檀明 孙斐 杨静 《模式识别与人工智能》 EI CSCD 北大核心 2024年第8期703-714,共12页
受限于图卷积网络的局部操作模式,传统图卷积网络骨架行为识别方法难以建模远关节点关系和长时间信息,无法捕捉动作间的局部微小变化.因此,文中提出基于跨通道特征增强图卷积网络的骨架行为识别(Cross-Channel Feature-Enhanced Graph C... 受限于图卷积网络的局部操作模式,传统图卷积网络骨架行为识别方法难以建模远关节点关系和长时间信息,无法捕捉动作间的局部微小变化.因此,文中提出基于跨通道特征增强图卷积网络的骨架行为识别(Cross-Channel Feature-Enhanced Graph Convolutional Network for Skeleton-Based Action Recognition,CFE-GCN),包括双部分分组图卷积模块、跨阶段部分密集连接模块及多尺度时间卷积模块.双部分分组图卷积模块采用分组策略,对人体关节点建模,提取多粒度特征,捕获关节点之间的局部细微差异.跨阶段部分密集连接模块建立节点与前网络层之间的关联,丰富早期信息,捕捉长期运动关节间的潜在关系,学习更全面的上下文特征.多尺度时间卷积模块执行不同感受野的时间卷积,捕捉运动在时间域上的短期依赖关系和长期依赖关系.在3个基准数据集上的实验表明CFE-GCN性能较优. 展开更多
关键词 图卷积网络 骨架行为识别 跨通道特征增强 密集连接
下载PDF
基于特征优化与深层次融合的目标检测算法 被引量:4
16
作者 谢誉 包梓群 +3 位作者 张娜 吴彪 涂小妹 包晓安 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第12期2403-2415,共13页
针对单阶段多边框检测算法(SSD)存在对小目标检测误差较大的问题,提出基于特征优化与深层次融合的目标检测算法,通过空间通道特征增强(SCFE)模块和深层次特征金字塔网络(DFPN)改进SSD.SCFE模块基于局部空间特征增强和全局通道特征增强... 针对单阶段多边框检测算法(SSD)存在对小目标检测误差较大的问题,提出基于特征优化与深层次融合的目标检测算法,通过空间通道特征增强(SCFE)模块和深层次特征金字塔网络(DFPN)改进SSD.SCFE模块基于局部空间特征增强和全局通道特征增强机制优化特征层,注重特征层的细节信息;DFPN基于残差空间通道增强模块改进特征金字塔网络,使不同尺度特征层进行深层次特征融合,提升目标检测精度.在训练阶段添加样本加权训练策略,使网络注重训练定位良好的样本和置信度高的样本.实验结果表明,在PASCAL VOC数据集上,所提算法在保证速度的同时检测精度由SSD的77.2%提升至79.7%;在COCO数据集上,所提算法的检测精度由SSD的25.6%提升至30.1%,对小目标的检测精度由SSD的6.8%提升至13.3%. 展开更多
关键词 目标检测 深层次特征金字塔网络(DFPN) 空间通道特征增强(SCFE) 样本加权训练 单阶段多边框检测算法(SSD)
下载PDF
基于区域感知的多尺度目标检测算法 被引量:1
17
作者 黄路 李泽平 +2 位作者 杨文帮 赵勇 张嫡 《计算机工程》 CAS CSCD 北大核心 2023年第12期178-185,共8页
针对目标检测网络主分支层的特征信息易丢失、不同尺度的特征表达能力不平衡等问题,提出一种基于区域感知的多尺度目标检测算法。在YOLOv5的基础上采用数据增强、改进的边框损失和非极大值抑制方法,构建1个更强健的基线模型,沿着通道方... 针对目标检测网络主分支层的特征信息易丢失、不同尺度的特征表达能力不平衡等问题,提出一种基于区域感知的多尺度目标检测算法。在YOLOv5的基础上采用数据增强、改进的边框损失和非极大值抑制方法,构建1个更强健的基线模型,沿着通道方向使用全局最大池化、全局平均池化、卷积等操作设计通道信息增强模块,并分别作用于骨干网络的每个主分支层,使得各个检测头在特征融合过程中也不会丢失主分支层的关键特征,以强化模型对重点区域的感知能力。利用加权特征融合方法融合不同尺度的特征信息,平衡不同尺度的输入特征对输出特征的表达能力,进而提高模型对多尺度目标的感知能力,通过调整模型的通道和深度,设计4种不同规模的网络结构。实验结果表明,相比YOLOv5s,该算法在Pascal VOC、MS COCO、Global Wheat、Wider Face、Motor Defect 5个数据集上的平均精度均值分别提高5.48、3.00、1.94、0.70和1.95个百分点。同时,该算法的平均精度均值最高为50.7%,分别比YOLOv4和Dynamic Head的最大模型提高7.2和3.0个百分点。 展开更多
关键词 目标检测 增强基线模型 通道信息增强 加权特征融合 多尺度目标
下载PDF
基于深度卷积循环网络的双通道语音增强算法 被引量:3
18
作者 董桂官 闫昭宇 +1 位作者 曾江蛟 张丹丹 《内蒙古科技大学学报》 CAS 2022年第3期244-250,共7页
为提高针对手机通话应用场景中的双通道语音增强效果,使用深度卷积循环网络实现双通道语音增强算法,结合通道间的空间信息特征对模型进行改进,最后使用相位敏感掩蔽作为训练目标来修复相位损失.实验结果表明,改进方法可以提升网络对双... 为提高针对手机通话应用场景中的双通道语音增强效果,使用深度卷积循环网络实现双通道语音增强算法,结合通道间的空间信息特征对模型进行改进,最后使用相位敏感掩蔽作为训练目标来修复相位损失.实验结果表明,改进方法可以提升网络对双通道信号的处理能力,得到语音质量和可懂度更高的双通道增强语音. 展开更多
关键词 深度卷积循环网络 双通道语音增强 空间信息特征 相位敏感掩蔽
下载PDF
基于多维注意力机制的单通道语音增强方法 被引量:1
19
作者 姚瑶 杨吉斌 +2 位作者 张雄伟 陈乐乐 范君怡 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期669-679,共11页
基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将... 基于深度学习的单通道语音增强技术能有效改善语音增强的质量,但在低信噪比环境下,语音增强的效果不能令人满意.为了改善低信噪比下单通道语音增强的质量,提出一种多维注意力机制(Multi-Dimensional Attention Mechanism,MDAM),通过将通道注意力和全局、局部时间注意力进行级联,充分挖掘深度神经网络各通道间语音特征的长短时相关性.在此基础上,设计了基于多维注意力机制的时域语音增强网络MDAM-Net,采用跳跃连接的编解码结构获取深层语音特征,并采用MDAM充分关注干净语音特征在网络通道间、时间方向上全局与局部范围的变化差异,可以更好地建模语音特征的上下文联系.仿真实验的结果表明,在保持较低模型参数量条件下,MDAM-Net在VoiceBank-DEMAND公开数据集上增强语音的PESQ(Perceptual Evaluation of Speech Quality)评分可以达到3.25.在低信噪比条件下,增强语音质量显著优于已有的单通道语音增强模型. 展开更多
关键词 单通道语音增强 多维注意力 通道注意力 TRANSFORMER
下载PDF
基于字典学习和稀疏表示的单通道语音增强算法综述 被引量:2
20
作者 叶中付 朱媛媛 贾翔宇 《应用声学》 CSCD 北大核心 2019年第4期645-652,共8页
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规... 如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对 4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。 展开更多
关键词 单通道语音增强 稀疏表示 字典学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部