-
题名细粒度图像分类综述
被引量:7
- 1
-
-
作者
申志军
穆丽娜
高静
史远航
刘志强
-
机构
阜阳师范大学计算机与信息工程学院
内蒙古农业大学计算机与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第1期51-60,共10页
-
基金
阜阳师范大学科学研究项目(2021KYQD0028)
内蒙古自治区科技攻关项目(2021GG0090)
+1 种基金
内蒙古农业大学博士科研启动基金资助项目(BJ2013B-1)
内蒙纪检监察大数据实验室开放课题(IMDBD2020015)。
-
文摘
细粒度图像具有类内方差大、类间方差小的特点,致使细粒度图像分类(FGIC)的难度远高于传统的图像分类任务。介绍了FGIC的应用场景、任务难点、算法发展历程和相关的常用数据集,主要概述相关算法:基于局部检测的分类方法通常采用连接、求和及池化等操作,模型训练较为复杂,在实际应用中存在较多局限;基于线性特征的分类方法模仿人类视觉的两个神经通路分别进行识别和定位,分类效果相对较优;基于注意力机制的分类方法模拟人类观察外界事物的机制,先扫描全景,后锁定重点关注区域并形成注意力焦点,分类效果有进一步的提高。最后针对目前研究的不足,展望FGIC下一步的研究方向。
-
关键词
细粒度图像分类
深度学习
卷积神经网络
注意力机制
计算机视觉
-
Keywords
fine-grained image categorization(fgic)
deep learning
Convolutional Neural Network(CNN)
attention mechanism
computer vision
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于自适应三线性池化网络的细粒度图像分类
被引量:2
- 2
-
-
作者
石进
徐杨
曹斌
-
机构
贵州大学大数据与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第5期239-246,254,共9页
-
基金
贵州省科技计划项目(黔合科支撑[2021]一般176)。
-
文摘
细粒度图像分类的关键在于提取图像中微妙的特征。现有基于弱监督方式的细粒度图像识别方法大多使用专家标注的边界注释辅助定位关键区域,存在标注成本高、训练过程复杂等问题。基于弱监督的双线性卷积神经网络方法因其学习到的特征空间更符合细粒度图像特性而具有一定的有效性,但忽略了层间的相互作用。针对细粒度图像识别领域存在的关键区域识别困难和层间交互关联弱的问题,融合二阶协方差通道注意力机制、自适应特征掩码与自适应三线性池化,提出自适应三线性池化网络ATP-Net,用于细粒度图像分类任务。通过二阶协方差通道注意力机制学习通道上的注意力向量,构建自适应特征掩码模块学习空间维上的注意力矩阵,设计自适应三线性池化模块学习特征的最终表示,以充分利用空间维、通道维上的信息。在CUB-200、Cars-196和Aircraft-1003个细粒度图像分类数据集上的实验结果表明,ATP-Net的分类精度分别为89.30%、94.20%和91.80%。
-
关键词
细粒度图像分类
注意力机制
特征掩码
自适应三线性池化
高阶交互
-
Keywords
fine-grained image categorization(fgic)
attention mechanism
feature mask
Adaptive Trilinear Pooling(ATP)
Higher-Order Interaction(HOI)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-