-
题名多区域注意力的细粒度图像分类网络
被引量:2
- 1
-
-
作者
白尚旺
王梦瑶
胡静
陈志泊
-
机构
太原科技大学计算机科学与技术学院
北京林业大学信息学院
-
出处
《计算机工程》
CSCD
北大核心
2024年第1期271-278,共8页
-
基金
国家自然科学基金(32071775)
山西省自然科学基金(202203021211189)
博士科研启动基金(20202057)。
-
文摘
目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型关注次要特征;然后通过背景去除以及上采样的方法获取图像更精准的局部图像,对提取到的局部特征进行位置统计,并以矩形框的方式获取图像整体,减少细节信息丢失;最后对局部与整体图像进行更加细致的学习。此外,设计联合损失函数,通过动态平衡难易样本和缩小类内差距的方法改善模型的识别效果。实验结果表明,该方法在公开的细粒度图像数据集CUB-200-2011、Stanford-Cars和FGVC-Aircraft上的准确率分别达到89.2%、94.8%、94.0%,相较于对比方法性能更优。
-
关键词
多区域注意力
细粒度图像分类
擦除策略
联合损失
深度学习
卷积神经网络
-
Keywords
multi-region attention
fine-grained image classification
erasure strategy
joint loss
deep learning
Convolutional Neural Network(CNN)
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名多区域融合注意力网络模型下的核性白内障分类
被引量:4
- 2
-
-
作者
章晓庆
肖尊杰
东田理沙
陈婉
胡衍
袁进
刘江
-
机构
南方科技大学计算机科学与工程系
TOMEY株式会社
中山大学中山眼科中心
中国科学院宁波材料技术与工程研究所慈溪生物医学工程研究所
广东省类脑智能计算重点实验室
-
出处
《中国图象图形学报》
CSCD
北大核心
2022年第3期948-960,共13页
-
基金
国家自然科学基金项目(8210072776)
广东省普通高校重点领域专项基金项目(202DZX3043)
广东省重点实验室项目(2020B121201001)。
-
文摘
目的核性白内障是主要致盲和导致视觉损害的眼科疾病,早期干预和白内障手术可以有效改善患者的视力和生活质量。眼前节光学相干断层成像图像(anterior segment optical coherence tomography,AS-OCT)能够非接触、客观和快速地获取白内障混浊信息。临床研究已经发现在AS-OCT图像中核性白内障严重程度与核性区域像素特征,如均值存在强相关性和高可重复性。但目前基于AS-OCT图像的自动核性白内障分类工作较少且分类结果还有较大提升空间。为此,本文提出一种新颖的多区域融合注意力网络(multi-region fusion attention network,MRA-Net)对AS-OCT图像中的核性白内障严重程度进行精准分类。方法在提出的多区域融合注意力模型中,本文设计了一个多区域融合注意力模块(multi-region fusion attention,MRA),对不同核性区域特征表示进行融合来增强分类结果;另外,本文验证了以人和眼为单位的AS-OCT图像数据集拆分方式对核性白内障分类结果的影响。结果在一个自建的AS-OCT图像数据集上结果表明,本文模型的总体分类准确率为87.78%,比对比方法至少提高了1%。在10种分类算法上的结果表明:以眼为单位的AS-OCT数据集优于以人为单位的AS-OCT数据集的分类结果,F1和Kappa评价指标分别最大提升了4.03%和8%。结论本文模型考虑了特征图不同区域特征分布的差异性,使核性白内障分类更加准确;不同数据集拆分方式的结果表明,考虑到同一个人两只眼的核性白内障严重程度相似,建议白内障的AS-OCT图像数据集拆分以人为单位。
-
关键词
核性白内障分类
眼前节光学相干断层成像图像(AS-OCT)
多区域融合注意力模块
深度学习
核性区域
-
Keywords
nuclear cataract classification
anterior segment optical coherence tomography(AS-OCT)image
multi-region fusion attention block
deep learning
nucleus region
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-