李宏毅机器学习之Attack and Defense
机器训练出来的模型不光性能要强,还要能够对抗人类的恶意、攻击

通过人为地对图片加上噪声,使得分类产生错误。

- 无目标的攻击:就是使得结果与事实的距离越远越好
- 有目标的攻击:输出与答案距离越远越好的同时,还与指定的输出越接近越好
- Constraint的限制可以简单理解为人眼看不出差别,但是机器可以给出完全不同的答案

一般对于限制的选择就是使用l2-norm与L-infinity,但是如上图右下角可知利用l2norm计算得到的d(x0,x′)d(x^0,x')d(