-
题名门控机制的图像分类网络
- 1
-
-
作者
姜文涛
高原
袁姮
刘万军
-
机构
辽宁工程技术大学软件学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第7期2393-2406,共14页
-
基金
国家自然科学基金(No.61601213)
辽宁省自然科学基金(No.20170540426)
辽宁省教育厅重点基金(No.LJYL049)~~。
-
文摘
为了提取更具表达能力和区分度的重点特征,减少网络传递时关键特征的流失,提高神经网络图像分类能力,提出一种新的门控机制图像分类网络(image classification Network of Gating Mechanism,GMNet).首先,使用门控卷积提取浅层特征,通过门控机制选择性地进行卷积操作,提高网络对原始图像关键特征的提取能力;其次,设计了一种插值门控卷积(Interpolation Gated Convolution,IGC)模块,利用Lanczos插值与门控卷积相结合,强化浅层特征的同时提取更具区分度的特征,提高特征的非线性表达能力;然后,设计了大核门控注意力机制(Large kernel Gated Attention Mechanism,LGAM)模块,将大核注意力与门控卷积相融合,实现了特征的选择性增强和选择性融合,提高关键区域特征的贡献度;最后,将大核门控注意力机制模块嵌入到残差分支中,让模型更有效地学习输入数据的特征和上下文信息,减少关键特征在网络信息传递时流失,提高网络的分类能力.本文方法在图像数据集CIFAR-10、CIFAR100、SVHN、Imagenette、Imagewoof上分别达到了97.05%、83.68%、97.68%、90.60%、83.05%的分类准确率,与当前先进的方法相比分别平均提高了3.26%、7.08%、3.44%、2.65%、5.02%.与现有主流网络模型相较,本文门控机制图像分类网络能够增强特征的非线性表达能力,提取更具表达能力和区分度的重点特征,减少关键特征流失,提高关键区域特征的贡献度,有效地提高神经网络图像分类能力.
-
关键词
图像分类
门控机制
门控卷积
插值门控卷积
大核门控注意力
残差网络
-
Keywords
image classification
gating mechanism
gated convolution
interpolation gated convolution
large kernel gated attention
residual network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-