Adversarial Attack

本文深入探讨了对抗性攻击的概念,包括白盒攻击与黑盒攻击的定义与实现。解析了通过优化图片使网络输出偏离正确结果的策略,以及在不同约束条件下的实施方法。同时,文章还讨论了在无法获取目标网络结构与参数的情况下,如何利用代理网络进行攻击。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Attack

尝试解释:在某个维度上,该类别的分布过于狭小陡峭,以至于稍微移动一点就到了别的不相关类别。

White-box attack

loss func

对图片进行optimition,使得网络输出远离正确输出,接近指定输出(Targeted Attack)。在一定约束下(更改不要太明显以至被发现)
在这里插入图片描述

constraint定义与实现

与原图片的距离函数,可选用l2-norm\L-infinity等衡量方式
实现时,更新得到的x如果不符合constraint,则选择符合constraint的点中最靠近x的那个。

Black-Box Attack

不可获得网络架构与参数 θ θ θ

可获得训练样本

训练一个proxy network模拟target network,攻击proxy network,得到的图片也可攻击target network.

不可获得训练样本

不断输入数据,得到n个输入-输出pair训练proxy network。

More

  • 一个相同的杂讯或许可以扰乱许多图片的判断
  • 可以对网络进行reprogramming,让它去做其他任务
  • 还可以攻击视频和文字
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值