基于可攻击空间假设的陷阱式集成对抗防御网络

Trap-type Ensemble Adversarial Defense Network Based on Attackable Space Hypothesis

下载PDF

导出

摘要如今,深度神经网络在各个领域取得了广泛的应用.然而研究表明,深度神经网络容易受到对抗样本的攻击,严重威胁着深度神经网络的应用和发展.现有的对抗防御方法大多需要以牺牲部分原始分类精度为代价,且强依赖于已有生成的对抗样本所提供的信息,无法兼顾防御的效力与效率.因此基于流形学习,从特征空间的角度提出可攻击空间对抗样本成因假设,并据此提出一种陷阱式集成对抗防御网络Trap-Net. Trap-Net在原始模型的基础上向训练数据添加陷阱类数据,使用陷阱式平滑损失函数建立目标数据类别与陷阱数据类别间的诱导关系以生成陷阱式网络.针对原始分类精度损失问题,利用集成学习的方式集成多个陷阱式网络以在不损失原始分类精度的同时,扩大陷阱类标签于特征空间所定义的靶标可攻击空间.最终, Trap-Net通过探测输入数据是否命中靶标可攻击空间以判断数据是否为对抗样本.基于MNIST、K-MNIST、F-MNIST、CIFAR-10和CIFAR-100数据集的实验表明, Trap-Net可在不损失干净样本分类精确度的同时具有很强的对抗样本防御泛化性,且实验结果验证可攻击空间对抗成因假设.在低扰动的白盒攻击场景中, Trap-Net对对抗样本的探测率高达85%以上.在高扰动的白盒攻击和黑盒攻击场景中, Trap-Net对对抗样本的探测率几乎高达100%.与其他探测式对抗防御方法相比, Trap-Net对白盒和黑盒对抗攻击皆有很强的防御效力.为对抗环境下深度神经网络提供一种高效的鲁棒性优化方法. Nowadays,deep neural networks(DNNs)have been widely used in various fields.However,research has shown that DNNs are vulnerable to attacks of adversarial examples(AEs),which seriously threaten the development and application of DNNs.Most of the existing adversarial defense methods need to sacrifice part of the original classification accuracy to obtain defense capability and strongly rely on the knowledge provided by the generated AEs,so they cannot balance the effectiveness and efficiency of defense.Therefore,based on manifold learning,this study proposes an origin hypothesis of AEs in attackable space from the feature space perspective and a trap-type ensemble adversarial defense network(Trap-Net).Trap-Net adds trap data to the training data based on the original model and uses the trap-type smoothing loss function to establish the seducing relationship between the target data and trap data,so as to generate trap-type networks.In order to address the problem that most adversarial defense methods sacrifice original classification accuracy,ensemble learning is used to ensemble multiple trap networks,so as to expand attackable target space defined by trap labels in the feature space and reduce the loss of the original classification accuracy.Finally,Trap-Net determines whether the input data are AEs by detecting whether the data hit the attackable target space.Experiments on MNIST,K-MNIST,F-MNIST,CIFAR-10,and CIFAR-100 datasets show that Trap-Net has strong defense generalization of AEs without sacrificing the classification accuracy of clean samples,and the results of experiments validate the adversarial origin hypothesis in attackable space.In the low-perturbation white-box attack scenario,Trap-Net achieves a detection rate of more than 85%for AEs.In the high-perturbation white-box attack and black-box attack scenarios,Trap-Net has a detection rate of almost 100%for AEs.Compared with other detection methods of AEs,Trap-Net is highly effective against white-box and black-box adversarial attacks,and it provides an

作者孙家泽温苏雷郑炜陈翔 SUN Jia-Ze;WEN Su-Lei;ZHENG Wei;CHEN Xiang(School of Computer Science and Technology,Xi’an University of Posts and Telecommunications,Xi’an 710121,China;Shaanxi Key Laboratory of Network Data Analysis and Intelligent Processing(Xi’an University of Posts and Telecommunications),Xi’an 710121,China;Xi’an Key Laboratory of Big Data and Intelligent Computing(Xi’an University of Posts and Telecommunications),Xi’an 710121,China;School of Software,Northwestern Polytechnical University,Xi’an 710072,China;School of Information Science and Technology,Nantong University,Nantong 226019,China)

机构地区西安邮电大学计算机学院陕西省网络数据分析与智能处理重点实验室(西安邮电大学) 西安市大数据与智能计算重点实验室(西安邮电大学) 西北工业大学软件学院南通大学信息科学技术学院

出处《软件学报》 EI CSCD 北大核心 2024年第4期1861-1884,共24页 Journal of Software

基金国家自然科学基金(61876138,62272387,62141208) 国家重点研发计划(2020YFC0833105Z1) 西安市重点产业链人工智能核心技术攻关项目(2022JH-RGZN-0028) 陕西省重点研发计划(2023-YBGY-030) 西安邮电大学创新基金(CXJJZL2021007)。

关键词深度神经网络对抗样本集成学习对抗防御鲁棒性优化 deep neural network(DNN) adversarial example ensemble learning adversarial defense robustness optimization

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1蔡秀霞,杜慧敏.对抗攻击及对抗样本生成方法综述[J].西安邮电大学学报,2021,26(1):67-75. 被引量：3
2黄立峰,庄文梓,廖泳贤,刘宁.一种基于进化策略和注意力机制的黑盒对抗攻击算法[J].软件学报,2021,32(11):3512-3529. 被引量：7
3潘文雯,王新宇,宋明黎,陈纯.对抗样本生成技术综述[J].软件学报,2020,31(1):67-81. 被引量：46

二级参考文献12

1赵宸.浅析黑盒测试与白盒测试[J].硅谷,2010,3(11):39-39. 被引量：5
2董喜双,关毅.基于有监督学习的依存句法分析模型综述[J].智能计算机与应用,2013,3(2):11-15. 被引量：2
3何清,李宁,罗文娟,史忠植.大数据下的机器学习算法综述[J].模式识别与人工智能,2014,27(4):327-336. 被引量：330
4黄龙,杨媛,王庆军,郭飞,高勇.结合全卷积神经网络的室内场景分割[J].中国图象图形学报,2019,24(1):64-72. 被引量：16
5刘栋,李素,曹志冬.深度学习及其在图像物体分类与检测中的应用综述[J].计算机科学,2016,43(12):13-23. 被引量：31
6周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1781
7黄继鹏,史颖欢,高阳.面向小目标的多尺度Faster-RCNN检测算法[J].计算机研究与发展,2019,56(2):319-327. 被引量：91
8马玉琨,毋立芳,简萌,刘方昊,杨洲.一种面向人脸活体检测的对抗样本生成算法[J].软件学报,2019,30(2):469-480. 被引量：16
9王文琦,汪润,王丽娜,唐奔宵.面向中文文本倾向性分类的对抗样本生成方法[J].软件学报,2019,30(8):2415-2427. 被引量：26
10张洁,张志昊.基于AE-WGAN的定向对抗样本生成及利用[J].南京邮电大学学报（自然科学版）,2020,40(1):63-69. 被引量：3

共引文献51

1郭书杰.基于快速边界攻击的黑盒对抗样本生成方法[J].计算机系统应用,2020,29(12):216-221. 被引量：2
2丁佳,许智武.基于Rectified Adam和颜色不变性的对抗迁移攻击[J].软件学报,2022,33(7):2525-2537. 被引量：3
3马舒岑,史建琦,黄滟鸿,秦胜潮,侯哲.基于最小不满足核的随机森林局部解释性分析[J].软件学报,2022,33(7):2447-2463. 被引量：2
4张帆,赵世坤,袁操,陈伟,刘小丽,赵涵捷.人脸识别反欺诈研究进展[J].软件学报,2022,33(7):2411-2446. 被引量：6
5李杉.对抗样本技术综述[J].科学大众（科技创新）,2020,0(1):40-41.
6胡永进,郭渊博,马骏,张晗,毛秀青.基于对抗样本的网络欺骗流量生成方法[J].通信学报,2020,41(9):59-70. 被引量：12
7仝鑫,王罗娜,王润正,王靖亚.面向中文文本分类的词级对抗样本生成方法[J].信息网络安全,2020(9):12-16. 被引量：15
8杨曼婷.基于防御蒸馏的对抗样本识别模型的研究[J].佳木斯大学学报（自然科学版）,2020,38(5):23-26.
9王晓萌,陈鸿龙,张安庆,李隽健,石乐义.基于深度学习的对抗样本生成技术研究综述[J].广州大学学报（自然科学版）,2020,19(2):35-47. 被引量：2
10仝鑫,王斌君,王润正,潘孝勤.面向自然语言处理的深度学习对抗样本综述[J].计算机科学,2021,48(1):258-267. 被引量：12

1许勇.新形势下湖北统计部门安全能力建设的思考[J].中国统计,2024(2):73-75.
2刘华咏,黄聪,金汉均.注意力增强的视觉Transformer图像检索算法[J].电子测量技术,2023,46(23):50-55. 被引量：1
3钱惠敏,毛邱凌,陈实,韩怡星,吕本杰.TCSNGAN:基于Transformer和谱归一化CNN的图像生成模型[J].计算机应用研究,2024,41(4):1221-1227. 被引量：2
4熊诚,巫朝霞.声誉评估的联邦学习激励机制设计与研究[J].信息记录材料,2024,25(2):196-200.
5刘冬杰,杜瑞颖,何琨,陈晶.PVOP:隐私保护和可验证的深度神经网络预测外包[J].武汉大学学报（理学版）,2023,69(6):699-708.
6张作干,马惠云.小白鼠胚胎肢芽尖端增厚外胚层及其邻近普通外胚层的电子显微镜观察[J].解剖学报,1964(1):1-22.
7逯子豪,徐延杰,孙浩,计科峰,匡纲要.基于多模型正交化的深度图像识别对抗鲁棒性增强技术[J].信号处理,2024,40(3):503-515.

软件学报

2024年第4期

浏览历史

内容加载中请稍等...

基于可攻击空间假设的陷阱式集成对抗防御网络

参考文献3

二级参考文献12

共引文献51

相关作者

相关机构

相关主题

浏览历史