【总结】explaining and harnessing adversarial examples

本文探讨了对抗样本的研究进展,包括box-constrained L-BFGS方法在对抗样本生成中的应用,以及对抗样本如何被不同结构的分类器误判。文章还介绍了对抗训练作为一种防御策略,并对比了线性模型与权值衰减的效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Szegedy et al.2014b《》:

  • box-constrained L-BFGS 能可靠地找到对抗样本
  • 在ImageNet等数据集上,对抗样本和原始样本的差距很小,人眼不可见
  • 同样的对抗样本会被不同结构的分类器误判
  • shallow softmax regression 同样对对抗样本很脆弱
  • training on adversarial examples can regularize the moddel–however, this was not practical at the time due to the need for expensive constrained optimization in the inner loop

对抗样本的线性解释:

对线性模型的解释:

非线性模型的线性扰动

fast gradient sign method(FGS):
η=ϵsign(xJ(θ,x,y))η=ϵsign(▽xJ(θ,x,y))
其他,在梯度方向上旋转x一个小角度也可以产生对抗样本

对抗训练(线性模型 vs 权值衰减)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值