基于对抗补丁的可泛化的Grad-CAM攻击方法被引量：3

Generalized Grad-CAM attacking method based on adversarial patch

下载PDF

导出

摘要为了验证Grad-CAM解释方法的脆弱性,提出了一种基于对抗补丁的Grad-CAM攻击方法。通过在CNN分类损失函数后添加对Grad-CAM类激活图的约束项,可以针对性地优化出一个对抗补丁并合成对抗图像。该对抗图像可在分类结果保持不变的情况下,使Grad-CAM解释结果偏向补丁区域,实现对解释结果的攻击。同时,通过在数据集上的批次训练及增加扰动范数约束,提升了对抗补丁的泛化性和多场景可用性。在ILSVRC2012数据集上的实验结果表明,与现有方法相比,所提方法能够在保持模型分类精度的同时,更简单有效地攻击Grad-CAM解释结果。 To verify the fragility of the Grad-CAM,a Grad-CAM attack method based on adversarial patch was proposed.By adding a constraint to the Grad-CAM in the classification loss function,an adversarial patch could be optimized and the adversarial image could be synthesized.The adversarial image guided the Grad-CAM interpretation result towards the patch area while the classification result remains unchanged,so as to attack the interpretations.Meanwhile,through batch-training on the dataset and increasing perturbation norm constraint,the generalization and the multi-scene usability of the adversarial patch were improved.Experimental results on the ILSVRC2012 dataset show that compared with the existing methods,the proposed method can attack the interpretation results of the Grad-CAM more simply and effectively while maintaining the classification accuracy.

作者司念文张文林屈丹常禾雨李盛祥牛铜 SI Nianwen;ZHANG Wenlin;QU Dan;CHANG Heyu;LI Shengxiang;NIU Tong(Department of Information System Engineering,Information Engineering University,Zhengzhou 450001,China;Department of Cryptogram Engineering,Information Engineering University,Zhengzhou 450001,China)

机构地区信息工程大学信息系统工程学院信息工程大学密码工程学院

出处《通信学报》 EI CSCD 北大核心 2021年第3期23-35,共13页 Journal on Communications

基金国家自然科学基金资助项目(No.61673395)。

关键词卷积神经网络可解释性对抗补丁类激活图显著图 convolutional neural network interpretability adversarial patch class activation map saliency map

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献2

1Han Xu,Yao Ma,Hao-Chen Liu,Debayan Deb,Hui Liu,Ji-Liang Tang,Anil K.Jain.Adversarial Attacks and Defenses in Images, Graphs and Text: A Review[J].International Journal of Automation and computing,2020,17(2):151-178. 被引量：21
2陈晋音,黄国瀚,张敦杰,张旭鸿,纪守领.一种面向图神经网络的图重构防御方法[J].计算机研究与发展,2021,58(5):1075-1091. 被引量：7

引证文献3

1吴翼腾,刘伟,于洪涛.图神经网络的标签翻转对抗攻击[J].通信学报,2021,42(9):65-74. 被引量：2
2程旭,王莹莹,张年杰,付章杰,陈北京,赵国英.基于空间感知的多级损失目标跟踪对抗攻击方法[J].通信学报,2021,42(11):242-254. 被引量：4
3赵彬粟,李灵芳,罗明星.基于注意力机制的对抗样本生成算法[J].四川师范大学学报（自然科学版）,2023,46(2):275-284.

二级引证文献6

1金柯君,于洪涛,吴翼腾,李邵梅,操晓春.基于改进投影梯度下降算法的图卷积网络投毒攻击[J].计算机工程,2022,48(10):176-183. 被引量：4
2刘依凡,欧博,熊剑琴.基于噪声不可见性的自适应图像对抗重编程方法[J].计算机科学,2023,50(4):110-116.
3陈铿锵,莫耀华.基于卷积神经网络人脸识别系统的安全性研究[J].武汉职业技术学院学报,2023,22(4):99-111.
4杨晓强,刘文昊.融合低通滤波器的孪生网络跟踪算法[J].计算机工程与应用,2023,59(23):237-245.
5符思政,曹春杰,刘志远,陶方舰,孙敬张.用于攻击深度哈希图像检索模型的双分支自编码器网络[J].电信科学,2023,39(11):96-106.
6金柯君,于洪涛,李邵梅,张建朋.基于注意力机制的图卷积网络防御方法[J].信息工程大学学报,2023,24(6):718-724.

1李静,程芃森,许丽丹,刘嘉勇.基于局部对抗训练的命名实体识别方法研究[J].四川大学学报（自然科学版）,2021,58(2):107-114. 被引量：4
2王作广,朱红松,孙利民.社工概念演化分析[J].信息安全学报,2021,6(2):12-29.
3姜雪婷.语文观背景下自主互助式阅读教学策略初探[J].科学咨询,2021(4):277-277.
4魏涛,沈文苗.稳健波束域MVDR高分辨算法[J].声学与电子工程,2021(1):5-9.
5王华学,许建.一洞双机TBM给排水设计和布置[J].长江工程职业技术学院学报,2021,38(1):15-19.
6于梦鸽.基于GIS的哈尔滨市118路公交站点选址优化[J].哈尔滨师范大学自然科学学报,2020,36(6):88-94. 被引量：4
7张波.新农村背景下农业经济管理的策略探讨[J].农民致富之友,2021(10):235-235.
8孔祥维,唐鑫泽,王子明.人工智能决策可解释性的研究综述[J].系统工程理论与实践,2021,41(2):524-536. 被引量：49
9孙豆,邢世其,高海峰,庞礴,李永祯,王雪松.基于特征增强的非均匀采样SAR三维稀疏成像[J].系统工程与电子技术,2021,43(4):901-910. 被引量：2
10许文妍,Varughese Anna Mary,张马忠.质量改进科学在麻醉学科的植入和发展[J].上海医学,2021,44(3):155-159. 被引量：3

通信学报

2021年第3期

浏览历史

内容加载中请稍等...

基于对抗补丁的可泛化的Grad-CAM攻击方法被引量：3

同被引文献2

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于对抗补丁的可泛化的Grad-CAM攻击方法 被引量：3

同被引文献2

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于对抗补丁的可泛化的Grad-CAM攻击方法被引量：3