本文提出了ATN(Adversarial Transformation Network)方法来生成对抗样本。之前的许多方法都是利用梯度信息进行攻击,本文通过训练一个神经网络,将原图作为输入,输出为对抗样本。在给定原始输入的情况下,对分类器的输出进行最小的修改,同时限制新分类以匹配对抗目标类。
ATN神经网络可以被定义为:
θ \theta θ是神经网络的参数
f f f是目标网络
优化问题为:
L x L_{x} Lx是视觉损失
L y L_{y} L<
本文提出了ATN(Adversarial Transformation Network)方法来生成对抗样本。之前的许多方法都是利用梯度信息进行攻击,本文通过训练一个神经网络,将原图作为输入,输出为对抗样本。在给定原始输入的情况下,对分类器的输出进行最小的修改,同时限制新分类以匹配对抗目标类。
ATN神经网络可以被定义为:
θ \theta θ是神经网络的参数
f f f是目标网络
优化问题为:
L x L_{x} Lx是视觉损失
L y L_{y} L<