ResPA攻击

ResPA攻击方法研究

本文提出了一种基于残差扰动搜索的对抗样本生成方法ResPA,通过优化全局平坦性提升迁移性。针对现有方法过度依赖局部尖锐区域的问题,利用指数移动平均梯度捕获历史方向变化,以残差梯度定位扰动点,平衡初始损失与扰动损失。算法结合平坦性正则项,在迭代中通过均匀采样和梯度聚合更新参数,最终生成在Lp范数约束下的对抗样本。实验表明,该方法能有效避免局部最优,显著提高对抗样本在黑盒攻击中的迁移性能。核心创新在于残差梯度机制和平坦性优化策略,解决了传统方法因局部尖锐区域导致的迁移性下降问题。

发现的问题:现有的文献忽视了扰动方向的影响。

提出解决方法:依靠残差梯度作为扰动方向,引导对抗样本朝向损失函数的平坦区域。且新方法不是严重依赖源自当前梯度的局部平坦作为扰动方向,而是利用当前梯度和参考梯度之间的残差来捕捉全局扰动方向的变化。

看图解析

可以看出的是,以前的模型是通过优化最尖端区域的扰动点的损失,而新方法优化的是对全局情况有利的扰动点的损失。

相关公式及理解

1.交叉熵损失函数

其中x为输入图像,y为其对应的真实标签,代理模型1的分类器输出记为,其中C是类别数,y=0或1是one-hot编码向量,满足系数与第k类,yk=1,否则yk=0.

实验目的,是使得对抗样本使分类器输出一个与真实标签不同的标签,同时保持人类不可感知。

2.不可感知性

通过遵守约束

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值