-
题名基于快速特征欺骗的通用扰动生成改进方法
- 1
-
-
作者
韦健杰
吕东辉
陆小锋
孙广玲
-
机构
上海大学通信与信息工程学院
-
出处
《应用科学学报》
CAS
CSCD
北大核心
2020年第6期986-994,共9页
-
基金
国家自然科学基金(No.U1636206)资助。
-
文摘
近年来,基于深度神经网络的应用日益广泛,然而深度神经网络容易受到由输入数据设计的微小扰动而带来的对抗性攻击,导致网络的错误输出,给智能系统的部署带来安全隐患.为了提高智能系统的抗风险能力,有必要对存在风险的扰动生成方法展开研究.快速特征欺骗(fast feature fool,FFF)是面向视觉任务的一种有效的通用扰动生成方法.考虑了输入图像在网络中的实际激活状态,以最大化原始图像和对抗样本之间的特征差异作为生成扰动的目标函数;同时考虑不同卷积层对于生成扰动的不同影响,在生成扰动的目标函数中,对不同卷积层对应的项加以不同权重.实验结果表明,改进的FFF方法攻击成功率更高,同时也具备更强的跨模型攻击能力.
-
关键词
深度神经网络
通用扰动
快速特征欺骗
特征差异
-
Keywords
deep neural networks
universal perturbations
fast feature fool(fff)
feature difference
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-