对抗样本（五）DeepFool

最新推荐文章于 2025-10-12 22:19:45 发布

原创

最新推荐文章于 2025-10-12 22:19:45 发布 · 3k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#DeepFool #对抗攻击 #对抗样本

本文深入探讨了DeepFool算法，一种高效生成对抗样本的方法，用于评估深度神经网络的鲁棒性。通过对比实验，展示了DeepFool在计算对抗扰动方面的优越性和效率，以及如何利用对抗样本进行网络微调，提升模型的鲁棒性。

文章目录

一、论文相关信息
二、论文背景及简介
三、论文内容总结
四、论文主要内容

一、论文相关信息

1.论文题目

DeepFool: a simple and accurate method to fool deep neural networks

2.论文时间

2015年

3.论文文献

https://arxiv.org/abs/1511.04599

二、论文背景及简介

目前，没有有效率的方法可以用来精确的计算深度模型对对抗扰动的鲁棒性。在这篇论文中，提出了DeepFool的算法来生成扰动，并且提出了一种量化分类器鲁棒性的方法。

三、论文内容总结

提出了一种计算分类器对对抗扰动的鲁棒性的评价方法
FGSM虽然快，但是它只是提供了最优扰动的一个粗略的估计，它执行的梯度的方法，经常得到的是局部最优解，DeepFool能够得到更小的扰动，甚至比FGSM小一个数量级
提出了一个新的对抗攻击方法DeepFool：

$r_*(x_0)=argmin||r||_2 \\ s.t. \ \ sign(f(x_0+r)) \ne sign(f(x_0))=-\frac{f(x_0)}{||w||_2^2}w$

在DeepFool中可以采用任意的lp norm
DeepFool训练出来的对抗样本进行Fine-tuning后，网络的鲁棒性变的更好。FGSM的Fine-tuning却让网络的鲁棒性变差。作者认为：用变动过大的扰动来进行Fine-tuning会让网络的鲁棒性变差。但博主认为：大的扰动在Fine-tuning后之所以让鲁棒性变差，是因为实验所使用的Epoch太少了，不足以让网络能够清楚地学习到大的扰动所带来的影响，才让鲁棒性变差，而增加Epoch或者增加网络的复杂性，就可以训练的很好。这只是个人理解。

附：如需继续学习对抗样本其他内容，请查阅对抗样本学习目录

四、论文主要内容

1、Introduction

针对样本x，标签 $\ \hat{k}(x)$ ，我们可以用如下关系来生成对抗样本：
$\bigtriangleup(x,\hat{k}) = min_r||r||_2 \ \ s.t.\ \hat{k}(x+r) \neq \hat{k}(x)$
我们，可以把 $\ \bigtriangleup(x,\hat{k})$ 称作 $\ \hat{k}$ 在点 $\ x$ 上的鲁棒性，分类器 $\ \hat{k}$ 的鲁棒性可以如下定义：
$\rho_{adv}(\hat{k}) = E_x \frac{\bigtriangleup(x,\hat{k})}{||x||_2}$
其中 $E_x$ 是对数据分布的期望。