期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多尺度频率通道注意力融合的声纹库构建方法
1
作者
陈彤
杨丰玉
+2 位作者
熊宇
严荭
邱福星
《计算机应用》
CSCD
北大核心
2024年第8期2407-2413,共7页
为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Ne...
为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Network)的基础上作了3点改进,包括:加入了多尺度频率通道注意力前端以从话语中获得高分辨率的特征表示、添加了多尺度通道注意力模块结合局部和全局的特征以融合多尺度信息、嵌入了特征注意力融合模块为多尺度的融合特征加权。这些改进使模型更好地利用多尺度的时频信息,提高识别能力。实验结果表明,与ECAPA-TDNN模型相比,MFCA-TDNN模型等错误率(EER)和最小检测代价函数(minDCF)分别下降5.9%和7.9%;最低的EER可达到3.83%,最低的minDCF可达到0.2202。
展开更多
关键词
声纹库
时延神经网络
多尺度特征提取
频率
通道
注意力
特征
注意力
融合
下载PDF
职称材料
用于胸片分类的自校正特征融合金字塔网络
2
作者
宫霄霖
程琦
李锵
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2024年第5期511-520,共10页
胸部疾病的病灶区域面积差异较大,易受健康部位的影响,难以定位,并且用于诊断疾病的X射线胸片样本数据分布不平衡,导致胸部疾病分类网络的分类准确度较低.针对胸部疾病分类任务中仍然存在的问题和挑战,本文提出了一种自校正特征融合金...
胸部疾病的病灶区域面积差异较大,易受健康部位的影响,难以定位,并且用于诊断疾病的X射线胸片样本数据分布不平衡,导致胸部疾病分类网络的分类准确度较低.针对胸部疾病分类任务中仍然存在的问题和挑战,本文提出了一种自校正特征融合金字塔网络.该网络使用自校正卷积增强疾病部位在特征图上以及通道之间的位置联系,在不引入额外参数量的条件下增大了卷积的感受野,避免无病区域的信息干扰;然后通过特征融合金字塔网络整合多尺度图像特征信息,在获取高分辨率特征图的同时,能够准确地定位病变区域,可以更好地识别不同尺度疾病的特征,在多标签分类任务上具有独特的优势;同时引入频率通道注意力机制强化网络对疾病特征的提取能力,在上采样和特征融合变换之前,减少全局平均池化过程中造成的特征丢失;最后提出一种轮次焦点损失函数区分不同种类胸部疾病的训练程度,根据分类难易程度区分样本,并在不同的训练轮次调整权重,以解决胸部疾病样本分布不平衡问题.在ChestX-ray14数据集上的平均AUC值可达0.853,在CheXpert数据集上的平均AUC值可达0.903,超过了近年来较为先进的网络模型.实验结果表明,该网络与传统的胸部疾病分类网络相比能有效地提高胸部疾病的分类精度,并且具有较强的泛化能力.
展开更多
关键词
胸部疾病
自校正卷积
特征融合金字塔网络
频率
通道
注意力
轮次焦点损失函数
下载PDF
职称材料
基于频率通道注意力网络的花生图像识别
被引量:
1
3
作者
王春龙
蒋仲铭
+3 位作者
鲍安红
龚凤
李丹
高涛
《花生学报》
北大核心
2022年第3期69-76,82,共9页
为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;...
为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;其次,通过可学习的自适应激活函数(Activate or Not,ACON)进行激活,动态地学习了激活函数的非线性程度,激活过程更加稳健而有效;最后,利用梯度集中(Gradient Centralization)的动量梯度下降算法优化损失函数。同等实验条件下对比VGG16、AlexNet和未改进的ResNet50模型,该模型性能最优,模型参数大小为127 MB,单张图耗时0.31 s,测试集上平均识别准确率为98%,高出模型改进前2.46个百分点。FAG-ResNet50模型可以很好地解决花生果分类问题,为智能花生果分级设备的开发奠定了技术基础。
展开更多
关键词
图像识别
频率
通道
注意力
自适应激活函数
梯度集中
花生分级
下载PDF
职称材料
改进YOLOv5网络在遥感图像目标检测中的应用
被引量:
8
4
作者
周华平
郭伟
《遥感信息》
CSCD
北大核心
2022年第5期23-30,共8页
针对遥感图像目标检测存在的尺度多样化、分布密集、小目标检测困难等问题,提出了一种改进YOLOv5网络的遥感图像目标检测的新方法Fca_YOLOv5。该方法引入了频率通道注意力网络,引导模型更加关注信息丰富的特征;将网络输入尺寸优化为1 0...
针对遥感图像目标检测存在的尺度多样化、分布密集、小目标检测困难等问题,提出了一种改进YOLOv5网络的遥感图像目标检测的新方法Fca_YOLOv5。该方法引入了频率通道注意力网络,引导模型更加关注信息丰富的特征;将网络输入尺寸优化为1 024,减少了图像缩放带来的影响;采用圆形平滑标签计算角度损失,对船舰目标进行旋转目标检测,进一步提升检测效果。在DOTA遥感图像数据集上进行实验,检测精度最高达到了75.9%,船舰旋转目标检测精度达到了96.1%,并且Fca_YOLOv5s的检测精度比YOLOv5s提高了3.1%。实验结果表明,改进网络对遥感图像中的微小目标具有较好的检测效果,有效提升了遥感图像的检测精度,对实现遥感图像中的微小目标检测具有一定的参考意义。
展开更多
关键词
YOLOv5
频率
通道
注意力
机制
网络输入尺寸
圆形平滑标签
小目标检测
下载PDF
职称材料
一种多尺度特征融合TDNN的声纹识别方法
5
作者
叶贤胜
高勇
《通信技术》
2024年第6期551-555,共5页
为了有效提高声纹识别的性能,改进了一种时延神经网络(Time Delay Neural Network,TDNN)架构,通过引入多尺度频率通道注意力(Multi-scale Frequency-channel Attention,MFA)以及多尺度通道注意力模块(Multi-scale Channel Attention Mod...
为了有效提高声纹识别的性能,改进了一种时延神经网络(Time Delay Neural Network,TDNN)架构,通过引入多尺度频率通道注意力(Multi-scale Frequency-channel Attention,MFA)以及多尺度通道注意力模块(Multi-scale Channel Attention Module,MS-CAM),从而增强模型对不同尺度特征的学习能力。MFA模块通过引入频率通道关注机制,有针对性地强化关键信息;MS-CAM模块进一步加强了对多尺度信息的融合,能更好地获得局部与全局的特征。结果表明,所使用的模型在声纹识别测试数据集VOXCELEB1的等错误率和最小检测代价函数2项指标分别为0.96和0.064,与基线系统相比下降幅度分别为8.6%和19%。
展开更多
关键词
声纹识别
多尺度
频率
通道
注意力
多尺度
通道
注意力
多尺度信息融合
下载PDF
职称材料
基于改进UFSA算法的车道线检测研究
被引量:
1
6
作者
王祥
柯福阳
+1 位作者
朱节中
夏德铸
《计算机仿真》
北大核心
2023年第5期213-219,共7页
由于传统车道线检测方法存在计算量大、无视觉线索和车道线遮挡等主要问题,制约着车道线检测的发展。目前,UFSA(UltraFast Structure-aware)算法的提出可以有效解决上述问题,并在车道线检测领域广泛的应用。而UFSA算法存在网络卷积和池...
由于传统车道线检测方法存在计算量大、无视觉线索和车道线遮挡等主要问题,制约着车道线检测的发展。目前,UFSA(UltraFast Structure-aware)算法的提出可以有效解决上述问题,并在车道线检测领域广泛的应用。而UFSA算法存在网络卷积和池化提取特征会丢失重要信息、边界信息不够敏感等问题,故加入ASPP(Atrous Spatial Pyramid Pooling)空洞金字塔池化与FCANet(Frequency Channel Attention)频率域通道注意力的融合机制定义为FCASPP(Frequency Channel Attention Spatial Pyramid Pooling),上述机制能够有效地在大感受野时,获取更丰富上下文信息并提取更有用和紧致的特征而抑制噪声信息,L-Dice(Lane Dice Loss)函数比Softmax函数更加关注车道边界的信息。通过消融实验验证了上述改进的有效性,且无需添加任何计算量。在TuSimple和CULane两个基准数据集中,检测精度与原文相比,分别提高了0.21个百分点和1.7个百分点,速度与原文相当,所提算法较具竞争力。
展开更多
关键词
车道线检测
频率
域
通道
注意力
空洞金字塔池化
检测精度
下载PDF
职称材料
题名
基于多尺度频率通道注意力融合的声纹库构建方法
1
作者
陈彤
杨丰玉
熊宇
严荭
邱福星
机构
南昌航空大学软件学院
出处
《计算机应用》
CSCD
北大核心
2024年第8期2407-2413,共7页
基金
国家自然科学基金资助项目(61762067)。
文摘
为解决声纹识别准确性易受外部因素影响的问题,提出一种基于多尺度频率通道注意力融合时延神经网络(MFCA-TDNN)模型的声纹识别算法。MFCA-TDNN在ECAPA-TDNN(Emphasized Channel Attention Propagation Aggregation Time Delay Neural Network)的基础上作了3点改进,包括:加入了多尺度频率通道注意力前端以从话语中获得高分辨率的特征表示、添加了多尺度通道注意力模块结合局部和全局的特征以融合多尺度信息、嵌入了特征注意力融合模块为多尺度的融合特征加权。这些改进使模型更好地利用多尺度的时频信息,提高识别能力。实验结果表明,与ECAPA-TDNN模型相比,MFCA-TDNN模型等错误率(EER)和最小检测代价函数(minDCF)分别下降5.9%和7.9%;最低的EER可达到3.83%,最低的minDCF可达到0.2202。
关键词
声纹库
时延神经网络
多尺度特征提取
频率
通道
注意力
特征
注意力
融合
Keywords
voiceprint library
delay neural network
multi-scale feature extraction
frequency-channel attention
feature attention fusion
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
用于胸片分类的自校正特征融合金字塔网络
2
作者
宫霄霖
程琦
李锵
机构
天津大学微电子学院
出处
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2024年第5期511-520,共10页
基金
国家自然科学基金资助项目(62272337)
天津大学自主创新基金资助项目(2021XZC-0024)
超声医学工程国家重点实验室开放课题资助项目(2022KFKT004).
文摘
胸部疾病的病灶区域面积差异较大,易受健康部位的影响,难以定位,并且用于诊断疾病的X射线胸片样本数据分布不平衡,导致胸部疾病分类网络的分类准确度较低.针对胸部疾病分类任务中仍然存在的问题和挑战,本文提出了一种自校正特征融合金字塔网络.该网络使用自校正卷积增强疾病部位在特征图上以及通道之间的位置联系,在不引入额外参数量的条件下增大了卷积的感受野,避免无病区域的信息干扰;然后通过特征融合金字塔网络整合多尺度图像特征信息,在获取高分辨率特征图的同时,能够准确地定位病变区域,可以更好地识别不同尺度疾病的特征,在多标签分类任务上具有独特的优势;同时引入频率通道注意力机制强化网络对疾病特征的提取能力,在上采样和特征融合变换之前,减少全局平均池化过程中造成的特征丢失;最后提出一种轮次焦点损失函数区分不同种类胸部疾病的训练程度,根据分类难易程度区分样本,并在不同的训练轮次调整权重,以解决胸部疾病样本分布不平衡问题.在ChestX-ray14数据集上的平均AUC值可达0.853,在CheXpert数据集上的平均AUC值可达0.903,超过了近年来较为先进的网络模型.实验结果表明,该网络与传统的胸部疾病分类网络相比能有效地提高胸部疾病的分类精度,并且具有较强的泛化能力.
关键词
胸部疾病
自校正卷积
特征融合金字塔网络
频率
通道
注意力
轮次焦点损失函数
Keywords
thoracic disease
self-calibrated convolution
feature fusion pyramid network
frequency channel attention
epoch focal loss function
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于频率通道注意力网络的花生图像识别
被引量:
1
3
作者
王春龙
蒋仲铭
鲍安红
龚凤
李丹
高涛
机构
西南大学工程技术学院
出处
《花生学报》
北大核心
2022年第3期69-76,82,共9页
基金
国家自然科学基金项目(4111900075)
重庆市自然科学基金项目(4312000227)
重庆市研究生科研创新项目(CYS211117)。
文摘
为了解决不同等级花生果的外形和颜色相似性大、难以分类识别的问题,本研究在ResNet50的基础上进行了改进。首先,在每个残差结构中引入频率通道注意力(Frequency Channel Attention,FCA)机制,减少图像特征信息的丢失,保留更多细节信息;其次,通过可学习的自适应激活函数(Activate or Not,ACON)进行激活,动态地学习了激活函数的非线性程度,激活过程更加稳健而有效;最后,利用梯度集中(Gradient Centralization)的动量梯度下降算法优化损失函数。同等实验条件下对比VGG16、AlexNet和未改进的ResNet50模型,该模型性能最优,模型参数大小为127 MB,单张图耗时0.31 s,测试集上平均识别准确率为98%,高出模型改进前2.46个百分点。FAG-ResNet50模型可以很好地解决花生果分类问题,为智能花生果分级设备的开发奠定了技术基础。
关键词
图像识别
频率
通道
注意力
自适应激活函数
梯度集中
花生分级
Keywords
image recognition
Frequency Channel Attention(FCA)
Activate or Not(ACON)
Gradient Concentration
peanut classification
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
S565.209.2 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
改进YOLOv5网络在遥感图像目标检测中的应用
被引量:
8
4
作者
周华平
郭伟
机构
安徽理工大学计算机科学与工程系
出处
《遥感信息》
CSCD
北大核心
2022年第5期23-30,共8页
基金
国家自然科学基金项目(61703005)
安徽省重点研究与开发计划(202004b11020029)。
文摘
针对遥感图像目标检测存在的尺度多样化、分布密集、小目标检测困难等问题,提出了一种改进YOLOv5网络的遥感图像目标检测的新方法Fca_YOLOv5。该方法引入了频率通道注意力网络,引导模型更加关注信息丰富的特征;将网络输入尺寸优化为1 024,减少了图像缩放带来的影响;采用圆形平滑标签计算角度损失,对船舰目标进行旋转目标检测,进一步提升检测效果。在DOTA遥感图像数据集上进行实验,检测精度最高达到了75.9%,船舰旋转目标检测精度达到了96.1%,并且Fca_YOLOv5s的检测精度比YOLOv5s提高了3.1%。实验结果表明,改进网络对遥感图像中的微小目标具有较好的检测效果,有效提升了遥感图像的检测精度,对实现遥感图像中的微小目标检测具有一定的参考意义。
关键词
YOLOv5
频率
通道
注意力
机制
网络输入尺寸
圆形平滑标签
小目标检测
Keywords
YOLOv5
FcaNet
network input size
circular smoothing label
small object detection
分类号
TP751 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
一种多尺度特征融合TDNN的声纹识别方法
5
作者
叶贤胜
高勇
机构
四川大学电子信息学院
出处
《通信技术》
2024年第6期551-555,共5页
文摘
为了有效提高声纹识别的性能,改进了一种时延神经网络(Time Delay Neural Network,TDNN)架构,通过引入多尺度频率通道注意力(Multi-scale Frequency-channel Attention,MFA)以及多尺度通道注意力模块(Multi-scale Channel Attention Module,MS-CAM),从而增强模型对不同尺度特征的学习能力。MFA模块通过引入频率通道关注机制,有针对性地强化关键信息;MS-CAM模块进一步加强了对多尺度信息的融合,能更好地获得局部与全局的特征。结果表明,所使用的模型在声纹识别测试数据集VOXCELEB1的等错误率和最小检测代价函数2项指标分别为0.96和0.064,与基线系统相比下降幅度分别为8.6%和19%。
关键词
声纹识别
多尺度
频率
通道
注意力
多尺度
通道
注意力
多尺度信息融合
Keywords
voiceprint recognition
multi-scale frequency channel attention
multi-scale channel attention
multi-scale information fusion
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于改进UFSA算法的车道线检测研究
被引量:
1
6
作者
王祥
柯福阳
朱节中
夏德铸
机构
南京信息工程大学自动化学院
南京信息工程大学遥感与测绘学院
南京信息工程大学无锡研究院
无锡学院
出处
《计算机仿真》
北大核心
2023年第5期213-219,共7页
基金
第十六批次江苏省“六大人才商峰”高层次人才项目(XYDXX-045)
2020年无锡市科技发展资金(N20201011)
西宁市科技计划(2019-Y-12)。
文摘
由于传统车道线检测方法存在计算量大、无视觉线索和车道线遮挡等主要问题,制约着车道线检测的发展。目前,UFSA(UltraFast Structure-aware)算法的提出可以有效解决上述问题,并在车道线检测领域广泛的应用。而UFSA算法存在网络卷积和池化提取特征会丢失重要信息、边界信息不够敏感等问题,故加入ASPP(Atrous Spatial Pyramid Pooling)空洞金字塔池化与FCANet(Frequency Channel Attention)频率域通道注意力的融合机制定义为FCASPP(Frequency Channel Attention Spatial Pyramid Pooling),上述机制能够有效地在大感受野时,获取更丰富上下文信息并提取更有用和紧致的特征而抑制噪声信息,L-Dice(Lane Dice Loss)函数比Softmax函数更加关注车道边界的信息。通过消融实验验证了上述改进的有效性,且无需添加任何计算量。在TuSimple和CULane两个基准数据集中,检测精度与原文相比,分别提高了0.21个百分点和1.7个百分点,速度与原文相当,所提算法较具竞争力。
关键词
车道线检测
频率
域
通道
注意力
空洞金字塔池化
检测精度
Keywords
Lane line detection
FCANet
ASPP
Detection accuracy
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多尺度频率通道注意力融合的声纹库构建方法
陈彤
杨丰玉
熊宇
严荭
邱福星
《计算机应用》
CSCD
北大核心
2024
0
下载PDF
职称材料
2
用于胸片分类的自校正特征融合金字塔网络
宫霄霖
程琦
李锵
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
3
基于频率通道注意力网络的花生图像识别
王春龙
蒋仲铭
鲍安红
龚凤
李丹
高涛
《花生学报》
北大核心
2022
1
下载PDF
职称材料
4
改进YOLOv5网络在遥感图像目标检测中的应用
周华平
郭伟
《遥感信息》
CSCD
北大核心
2022
8
下载PDF
职称材料
5
一种多尺度特征融合TDNN的声纹识别方法
叶贤胜
高勇
《通信技术》
2024
0
下载PDF
职称材料
6
基于改进UFSA算法的车道线检测研究
王祥
柯福阳
朱节中
夏德铸
《计算机仿真》
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部