期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于多尺度频率通道注意力融合的声纹库构建方法
1
作者 陈彤 杨丰玉 +2 位作者 熊宇 严荭 邱福星 《计算机应用》 CSCD 北大核心 2024年第8期2407-2413,共7页
为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Ne... 为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Network)的基础上作了3点改进,包括:加入了多尺度频率通道注意力前端以从话语中获得高分辨率的特征表示、添加了多尺度通道注意力模块结合局部和全局的特征以融合多尺度信息、嵌入了特征注意力融合模块为多尺度的融合特征加权。这些改进使模型更好地利用多尺度的时频信息,提高识别能力。实验结果表明,与ECAPA-TDNN模型相比,MFCA-TDNN模型等错误率(EER)和最小检测代价函数(minDCF)分别下降5.9%和7.9%;最低的EER可达到3.83%,最低的minDCF可达到0.2202。 展开更多
关键词 声纹库 时延神经网络 多尺度特征提取 频率通道注意力 特征注意力融合
下载PDF
用于胸片分类的自校正特征融合金字塔网络
2
作者 宫霄霖 程琦 李锵 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2024年第5期511-520,共10页
胸部疾病的病灶区域面积差异较大,易受健康部位的影响,难以定位,并且用于诊断疾病的X射线胸片样本数据分布不平衡,导致胸部疾病分类网络的分类准确度较低.针对胸部疾病分类任务中仍然存在的问题和挑战,本文提出了一种自校正特征融合金... 胸部疾病的病灶区域面积差异较大,易受健康部位的影响,难以定位,并且用于诊断疾病的X射线胸片样本数据分布不平衡,导致胸部疾病分类网络的分类准确度较低.针对胸部疾病分类任务中仍然存在的问题和挑战,本文提出了一种自校正特征融合金字塔网络.该网络使用自校正卷积增强疾病部位在特征图上以及通道之间的位置联系,在不引入额外参数量的条件下增大了卷积的感受野,避免无病区域的信息干扰;然后通过特征融合金字塔网络整合多尺度图像特征信息,在获取高分辨率特征图的同时,能够准确地定位病变区域,可以更好地识别不同尺度疾病的特征,在多标签分类任务上具有独特的优势;同时引入频率通道注意力机制强化网络对疾病特征的提取能力,在上采样和特征融合变换之前,减少全局平均池化过程中造成的特征丢失;最后提出一种轮次焦点损失函数区分不同种类胸部疾病的训练程度,根据分类难易程度区分样本,并在不同的训练轮次调整权重,以解决胸部疾病样本分布不平衡问题.在ChestX-ray14数据集上的平均AUC值可达0.853,在CheXpert数据集上的平均AUC值可达0.903,超过了近年来较为先进的网络模型.实验结果表明,该网络与传统的胸部疾病分类网络相比能有效地提高胸部疾病的分类精度,并且具有较强的泛化能力. 展开更多
关键词 胸部疾病 自校正卷积 特征融合金字塔网络 频率通道注意力 轮次焦点损失函数
下载PDF
基于频率通道注意力网络的花生图像识别 被引量:1
3
作者 王春龙 蒋仲铭 +3 位作者 鲍安红 龚凤 李丹 高涛 《花生学报》 北大核心 2022年第3期69-76,82,共9页
为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;... 为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;其次,通过可学习的自适应激活函数(Activate or Not,ACON)进行激活,动态地学习了激活函数的非线性程度,激活过程更加稳健而有效;最后,利用梯度集中(Gradient Centralization)的动量梯度下降算法优化损失函数。同等实验条件下对比VGG16、AlexNet和未改进的ResNet50模型,该模型性能最优,模型参数大小为127 MB,单张图耗时0.31 s,测试集上平均识别准确率为98%,高出模型改进前2.46个百分点。FAG-ResNet50模型可以很好地解决花生果分类问题,为智能花生果分级设备的开发奠定了技术基础。 展开更多
关键词 图像识别 频率通道注意力 自适应激活函数 梯度集中 花生分级
下载PDF
改进YOLOv5网络在遥感图像目标检测中的应用 被引量:8
4
作者 周华平 郭伟 《遥感信息》 CSCD 北大核心 2022年第5期23-30,共8页
针对遥感图像目标检测存在的尺度多样化、分布密集、小目标检测困难等问题,提出了一种改进YOLOv5网络的遥感图像目标检测的新方法Fca_YOLOv5。该方法引入了频率通道注意力网络,引导模型更加关注信息丰富的特征;将网络输入尺寸优化为1 0... 针对遥感图像目标检测存在的尺度多样化、分布密集、小目标检测困难等问题,提出了一种改进YOLOv5网络的遥感图像目标检测的新方法Fca_YOLOv5。该方法引入了频率通道注意力网络,引导模型更加关注信息丰富的特征;将网络输入尺寸优化为1 024,减少了图像缩放带来的影响;采用圆形平滑标签计算角度损失,对船舰目标进行旋转目标检测,进一步提升检测效果。在DOTA遥感图像数据集上进行实验,检测精度最高达到了75.9%,船舰旋转目标检测精度达到了96.1%,并且Fca_YOLOv5s的检测精度比YOLOv5s提高了3.1%。实验结果表明,改进网络对遥感图像中的微小目标具有较好的检测效果,有效提升了遥感图像的检测精度,对实现遥感图像中的微小目标检测具有一定的参考意义。 展开更多
关键词 YOLOv5 频率通道注意力机制 网络输入尺寸 圆形平滑标签 小目标检测
下载PDF
一种多尺度特征融合TDNN的声纹识别方法
5
作者 叶贤胜 高勇 《通信技术》 2024年第6期551-555,共5页
为了有效提高声纹识别的性能,改进了一种时延神经网络(Time Delay Neural Network,TDNN)架构,通过引入多尺度频率通道注意力(Multi-scale Frequency-channel Attention,MFA)以及多尺度通道注意力模块(Multi-scale Channel Attention Mod... 为了有效提高声纹识别的性能,改进了一种时延神经网络(Time Delay Neural Network,TDNN)架构,通过引入多尺度频率通道注意力(Multi-scale Frequency-channel Attention,MFA)以及多尺度通道注意力模块(Multi-scale Channel Attention Module,MS-CAM),从而增强模型对不同尺度特征的学习能力。MFA模块通过引入频率通道关注机制,有针对性地强化关键信息;MS-CAM模块进一步加强了对多尺度信息的融合,能更好地获得局部与全局的特征。结果表明,所使用的模型在声纹识别测试数据集VOXCELEB1的等错误率和最小检测代价函数2项指标分别为0.96和0.064,与基线系统相比下降幅度分别为8.6%和19%。 展开更多
关键词 声纹识别 多尺度频率通道注意力 多尺度通道注意力 多尺度信息融合
下载PDF
基于改进UFSA算法的车道线检测研究 被引量:1
6
作者 王祥 柯福阳 +1 位作者 朱节中 夏德铸 《计算机仿真》 北大核心 2023年第5期213-219,共7页
由于传统车道线检测方法存在计算量大、无视觉线索和车道线遮挡等主要问题,制约着车道线检测的发展。目前,UFSA(UltraFast Structure-aware)算法的提出可以有效解决上述问题,并在车道线检测领域广泛的应用。而UFSA算法存在网络卷积和池... 由于传统车道线检测方法存在计算量大、无视觉线索和车道线遮挡等主要问题,制约着车道线检测的发展。目前,UFSA(UltraFast Structure-aware)算法的提出可以有效解决上述问题,并在车道线检测领域广泛的应用。而UFSA算法存在网络卷积和池化提取特征会丢失重要信息、边界信息不够敏感等问题,故加入ASPP(Atrous Spatial Pyramid Pooling)空洞金字塔池化与FCANet(Frequency Channel Attention)频率域通道注意力的融合机制定义为FCASPP(Frequency Channel Attention Spatial Pyramid Pooling),上述机制能够有效地在大感受野时,获取更丰富上下文信息并提取更有用和紧致的特征而抑制噪声信息,L-Dice(Lane Dice Loss)函数比Softmax函数更加关注车道边界的信息。通过消融实验验证了上述改进的有效性,且无需添加任何计算量。在TuSimple和CULane两个基准数据集中,检测精度与原文相比,分别提高了0.21个百分点和1.7个百分点,速度与原文相当,所提算法较具竞争力。 展开更多
关键词 车道线检测 频率通道注意力 空洞金字塔池化 检测精度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部