期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于多尺度频率通道注意力融合的声纹库构建方法
1
作者 陈彤 杨丰玉 +2 位作者 熊宇 严荭 邱福星 《计算机应用》 CSCD 北大核心 2024年第8期2407-2413,共7页
为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Ne... 为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Network)的基础上作了3点改进,包括:加入了多尺度频率通道注意力前端以从话语中获得高分辨率的特征表示、添加了多尺度通道注意力模块结合局部和全局的特征以融合多尺度信息、嵌入了特征注意力融合模块为多尺度的融合特征加权。这些改进使模型更好地利用多尺度的时频信息,提高识别能力。实验结果表明,与ECAPA-TDNN模型相比,MFCA-TDNN模型等错误率(EER)和最小检测代价函数(minDCF)分别下降5.9%和7.9%;最低的EER可达到3.83%,最低的minDCF可达到0.2202。 展开更多
关键词 声纹库 时延神经网络 多尺度特征提取 频率通道注意力 特征注意力融合
下载PDF
改进YOLOv4-tiny的安全帽佩戴检测算法 被引量:7
2
作者 王建波 武友新 《计算机工程与应用》 CSCD 北大核心 2023年第4期183-190,共8页
针对已有的安全帽检测方法存在的模型参数量大,难以部署在边缘设备上,以及对较小目标检测效果不好等问题,提出一种改进YOLOv4-tiny的轻量级安全帽检测模型。针对小目标丢失过多问题,增加了检测小目标的尺度,提升模型关注小目标的能力。... 针对已有的安全帽检测方法存在的模型参数量大,难以部署在边缘设备上,以及对较小目标检测效果不好等问题,提出一种改进YOLOv4-tiny的轻量级安全帽检测模型。针对小目标丢失过多问题,增加了检测小目标的尺度,提升模型关注小目标的能力。提出了一种轻量级特征融合结构,缓解特征融合部分的语义混叠问题,并且在模型中融入了优化的注意力模块,提升模型捕获上下文信息的能力。针对分类与回归任务之间的冲突,将模型预测头替换为解耦合的预测头,采用并行的卷积分别进行分类与回归任务。将改进的模型命名为HM-YOLO,通过实验验证了HM-YOLO算法的有效性,相比YOLOv4-tiny模型,HM-YOLO模型平均精度提升了14.2个百分点,参数量减少了19%,检测速度为为63 FPS,具有良好的检测精度和实时性,更易于部署在边缘设备上。 展开更多
关键词 小目标检测 频域注意力 解耦头 YOLOv4 轻量级网络
下载PDF
用于胸片分类的自校正特征融合金字塔网络
3
作者 宫霄霖 程琦 李锵 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2024年第5期511-520,共10页
胸部疾病的病灶区域面积差异较大,易受健康部位的影响,难以定位,并且用于诊断疾病的X射线胸片样本数据分布不平衡,导致胸部疾病分类网络的分类准确度较低.针对胸部疾病分类任务中仍然存在的问题和挑战,本文提出了一种自校正特征融合金... 胸部疾病的病灶区域面积差异较大,易受健康部位的影响,难以定位,并且用于诊断疾病的X射线胸片样本数据分布不平衡,导致胸部疾病分类网络的分类准确度较低.针对胸部疾病分类任务中仍然存在的问题和挑战,本文提出了一种自校正特征融合金字塔网络.该网络使用自校正卷积增强疾病部位在特征图上以及通道之间的位置联系,在不引入额外参数量的条件下增大了卷积的感受野,避免无病区域的信息干扰;然后通过特征融合金字塔网络整合多尺度图像特征信息,在获取高分辨率特征图的同时,能够准确地定位病变区域,可以更好地识别不同尺度疾病的特征,在多标签分类任务上具有独特的优势;同时引入频率通道注意力机制强化网络对疾病特征的提取能力,在上采样和特征融合变换之前,减少全局平均池化过程中造成的特征丢失;最后提出一种轮次焦点损失函数区分不同种类胸部疾病的训练程度,根据分类难易程度区分样本,并在不同的训练轮次调整权重,以解决胸部疾病样本分布不平衡问题.在ChestX-ray14数据集上的平均AUC值可达0.853,在CheXpert数据集上的平均AUC值可达0.903,超过了近年来较为先进的网络模型.实验结果表明,该网络与传统的胸部疾病分类网络相比能有效地提高胸部疾病的分类精度,并且具有较强的泛化能力. 展开更多
关键词 胸部疾病 自校正卷积 特征融合金字塔网络 频率通道注意力 轮次焦点损失函数
下载PDF
基于频域通道注意力的YOLOv3网络的雾天海洋图像船舶检测 被引量:2
4
作者 叶乐 李朝锋 《上海海事大学学报》 北大核心 2023年第2期18-24,共7页
为解决在雾天背景下现有的船舶检测算法准确率低、召回率不高的问题,在YOLOv3网络的特征提取模块加入空间金字塔池化模块用以丰富特征图的表达能力,在特征融合模块引入频域通道注意力机制来抑制背景噪声,在预测模块采用K均值算法重新设... 为解决在雾天背景下现有的船舶检测算法准确率低、召回率不高的问题,在YOLOv3网络的特征提取模块加入空间金字塔池化模块用以丰富特征图的表达能力,在特征融合模块引入频域通道注意力机制来抑制背景噪声,在预测模块采用K均值算法重新设计预测锚框大小以适应待检测目标的形状。实验结果表明:基于频域通道注意力的YOLOv3网络在雾天背景下对船舶的检测精度更高,在测试集上平均精确率可达到92.98%,准确率可达到93.06%,召回率可达到92.25%;检测速度可达到61帧/s。本文算法满足船舶实时检测的需求,为未来智能船舶的发展提出了一种兼顾准确率和实时性的船舶检测方法。 展开更多
关键词 船舶检测 卷积神经网络 频域通道注意力机制 YOLOv3
下载PDF
基于频率通道注意力网络的花生图像识别 被引量:1
5
作者 王春龙 蒋仲铭 +3 位作者 鲍安红 龚凤 李丹 高涛 《花生学报》 北大核心 2022年第3期69-76,82,共9页
为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;... 为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;其次,通过可学习的自适应激活函数(Activate or Not,ACON)进行激活,动态地学习了激活函数的非线性程度,激活过程更加稳健而有效;最后,利用梯度集中(Gradient Centralization)的动量梯度下降算法优化损失函数。同等实验条件下对比VGG16、AlexNet和未改进的ResNet50模型,该模型性能最优,模型参数大小为127 MB,单张图耗时0.31 s,测试集上平均识别准确率为98%,高出模型改进前2.46个百分点。FAG-ResNet50模型可以很好地解决花生果分类问题,为智能花生果分级设备的开发奠定了技术基础。 展开更多
关键词 图像识别 频率通道注意力 自适应激活函数 梯度集中 花生分级
下载PDF
一种多尺度特征融合TDNN的声纹识别方法
6
作者 叶贤胜 高勇 《通信技术》 2024年第6期551-555,共5页
为了有效提高声纹识别的性能,改进了一种时延神经网络(Time Delay Neural Network,TDNN)架构,通过引入多尺度频率通道注意力(Multi-scale Frequency-channel Attention,MFA)以及多尺度通道注意力模块(Multi-scale Channel Attention Mod... 为了有效提高声纹识别的性能,改进了一种时延神经网络(Time Delay Neural Network,TDNN)架构,通过引入多尺度频率通道注意力(Multi-scale Frequency-channel Attention,MFA)以及多尺度通道注意力模块(Multi-scale Channel Attention Module,MS-CAM),从而增强模型对不同尺度特征的学习能力。MFA模块通过引入频率通道关注机制,有针对性地强化关键信息;MS-CAM模块进一步加强了对多尺度信息的融合,能更好地获得局部与全局的特征。结果表明,所使用的模型在声纹识别测试数据集VOXCELEB1的等错误率和最小检测代价函数2项指标分别为0.96和0.064,与基线系统相比下降幅度分别为8.6%和19%。 展开更多
关键词 声纹识别 多尺度频率通道注意力 多尺度通道注意力 多尺度信息融合
下载PDF
融合频率和通道卷积注意的脑电(EEG)情感识别 被引量:3
7
作者 柴冰 李冬冬 +1 位作者 王喆 高大启 《计算机科学》 CSCD 北大核心 2021年第12期312-318,共7页
现有的脑电(EEG)情感识别研究普遍采用神经网络和单一注意机制来学习情感特征,具有相对单一的特征表示。而神经科学研究表明,不同频率和电极通道的脑电信号对情感有不同的响应程度,因此文中提出了一种融合频率和电极通道卷积注意的方法... 现有的脑电(EEG)情感识别研究普遍采用神经网络和单一注意机制来学习情感特征,具有相对单一的特征表示。而神经科学研究表明,不同频率和电极通道的脑电信号对情感有不同的响应程度,因此文中提出了一种融合频率和电极通道卷积注意的方法,用于脑电情感识别。具体来说,首先将EEG信号分解到不同的频带上并提取相应的帧级特征,然后用预激活残差网络来学习深层次的脑电情感相关特征,同时在残差网络的每个预激活残差单元中都融入频率和电极通道卷积注意模块,以建模脑电信号的频率和电极通道信息,并生成脑电特征的最终注意表示。在DEAP和DREAMER数据集上的独立于受试者场景下的实验结果表明,所提出的卷积注意方法相比单一注意机制更有助于增强EEG信号中情感显著信息的导入,并且能产生更好的情感识别结果。 展开更多
关键词 脑电情感识别 特征表示 残差网络 预激活残差单元 频率和电极通道卷积注意
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部