DeepFool对抗算法_学习笔记

最新推荐文章于 2025-07-17 14:33:19 发布

Erpim

最新推荐文章于 2025-07-17 14:33:19 发布

阅读量1.6w

点赞数 13

CC 4.0 BY-SA版权

分类专栏：人工智能对抗样本文章标签： DeepFool 对抗样本攻击

本文链接：https://blog.youkuaiyun.com/qq_35414569/article/details/80966564

人工智能同时被 2 个专栏收录

8 篇文章

订阅专栏

对抗样本

6 篇文章

订阅专栏

本文深入剖析了DeepFool算法，介绍了其如何通过最小化扰动来生成对抗样本，并评估分类器的鲁棒性。从二分类器到多分类器，逐步解释了算法原理及应用场景。

前言

本篇博客出于学习交流目的，主要是用来记录自己学习中遇到的问题和心路历程，方便之后回顾。过程中可能引用其他大牛的博客，文末会给出相应链接，侵删！

DeepFool算法
特点：提出鲁棒性评估指标
论文原文：DeepFool: a simple and accurate method to fool deep neural networks

正文

之前的博客讲了FGSM算法，但是有人可能会有疑问，怎么确定 $\varepsilon$ 的大小，取值大小这会对算法效果产生很大影响，那么今天的这个算法可以避免这个问题。
文章首次提出了一个分类器鲁棒性的评估指标：
图像样本： $x$ ， $x\in \mathbb{R}^n$
分类器： $\hat{k}(x)$
对抗扰动： $r$
分类器在 $x$ 处的鲁棒性 $\Delta(x;\hat{k})$ ：

Δ (x; k^) : = min r | | r | | 2 s . t . k^(x + r) \neq k^(x)

$\Delta(x;\hat{k}):=\min_{\textbf{r}}\left||\textbf{r}|\right|_2 \ \ s.t.\hat{k}(x+\textbf{r})\neq\hat{k}(x)$ 即x到分类边界的距离，下文会更详细理解。

分类器 $\hat{k}(x)$ 的鲁棒性：

ρ a d v (k^) = E x Δ ( x ; k ^ ) | | x | | 2

$\rho_{adv}(\hat{k})=\mathbb{E}_{x}\dfrac{\Delta(x;\hat{k})}{||x||_2}$
样本离分类边界越远，样本2范数越小，评测数值越大表示越鲁棒。

我们先从二分类器看，多分类器可以看做是多个二分类器的共同作用。
二分类问题
二分类器： $\hat{k}(x)=sign(\textbf{w}^Tx+b):=sign(f(x))$
图为sign()函数

分类边界： $\mathscr{F}=\{x:f(x)=0\}$ ，分界线两边分别为正负类
扰动向量：
$\textbf{r}_{\star}(\textbf{x}_0):=\arg\min\limits_{\textbf{r}}||\textbf{r}||_2$
$s.t.\ sign(f(x_0+\textbf{r}))\neq sign(f(x_0))$
$=-\dfrac{f(x_0)}{||\textbf{w}||_2^2}\textbf{w}$

借助原文中的图例来看公式可以很好理解

其实这个公式可以理解为样本到分类边界的最短距离 $\frac{f\left ( x_{0} \right )}{\left \| \textbf{w} \right \|_{2}}$ 乘上法线方向的单位向量 $\frac{\textbf{w} }{\left \| \textbf{w} \right \|_{2}}$ ,因为始终指向分类边界方向，所以有个负号。

如果是迭代算法，那么扰动计算公式将变为：

a r g r i m i n ∥ r i ∥ 2 s u b j e c t t o f (x i) + ▽ f (x i) T r i = 0

$arg_{r_{i}}min\left \| r_{i}\right \|_{2}\ subject\ to\ f\left ( x_{i} \right )+\bigtriangledown f\left ( x_{i} \right )^{T}r_{i}=0$

多分类问题
类标数： $c$ ，即映射空间 $\mathbb{R}^n \rightarrow \mathbb{R}^c$
分类函数： $f(x)=\textbf{W}^Tx+\textbf{b}$
分类器： $\hat{k}(x)=\arg\max\limits_{k}{f_k(x)}$ ， $f_k(x)$ 是向量 $f(x)$ 的第 $k$ 个维度，也可看做是第 $k$ 个子分类器。
扰动向量：
$\arg\min\limits_{\textbf{r}}||\textbf{r}||_2$
$s.t. \exists k: \textbf{w}^T_k(x_0+\textbf{r})+\textbf{b}_k\geq \textbf{w}^T_{\hat{k}(x_0)}(x_0+\textbf{r})+\textbf{b}_{\hat{k}(x_0)}$
其中 $\textbf{w}_k$ 是 $\textbf{W}$ 的第 $k$ 列，即第 $k$ 个子分类器的权值向量。
要使得分类结果改变，必须保证至少存在一个非原始类标的分类器结果大于原始分类函数结果。
第 $k$ 个分类边界： $\mathscr{F}_k=\{x:f_k(x)-f_{\hat{k}(x_0)}(x)=0\}$
$x_0$ 与所在的凸区域可由超平面 $P$ 围成：

P = ⋂_{k = 1}^{c} {x : f_{\hat{k} (x_{0})} (x) \geq f_{k} (x)}

$P=\bigcap\limits_{k=1}^{c}\{x:f_{\hat{k}(x_0)}(x)\geq f_{k}(x)\}$
这时候我们需要得到一个点到某分类函数边界的最小距离，即：

l^(x 0) = arg min k \neq k^(x 0) | f k ( x 0 ) - f k ^ ( x 0 ) ( x 0 ) | | | w k - w k ^ ( x 0 ) | | 2

$\hat{l}(x_0)=\arg\min\limits_{k\neq \hat{k}(x_0)}\dfrac{|f_k(x_0)-f_{\hat{k}(x_0)}(x_0)|}{||\textbf{w}_{k}-\textbf{w}_{\hat{k}(x_0)}||_2}$
同样用原文的图来帮助理解：

假设有4个类，

x0 x 0 $x_0$ 属于原本第4类，那么我们可以根据

Fk={x:fk(x)−f4(x)=0} F k = { x : f k ( x ) − f 4 ( x ) = 0 } $\mathscr{F}_k=\{x:f_k(x)-f_4(x)=0\}$ 确定一个超平面如图绿线围成。然后计算分别距离各个分类器的最小距离。

那么我们就得到最小扰动 $\textbf{r}_{\star}(x_0)$ ：

r ⋆ (x 0) = | f l ^ ( x 0 ) ( x 0 ) - f k ^ ( x 0 ) ( x 0 ) | | | w l ^ ( x 0 ) - w k ^ ( x 0 ) | | 2 2 (w l^(x 0) - w k^(x 0))

$\textbf{r}_{\star}(x_0)=\dfrac{|f_{\hat{l}(x_0)}(x_0)-f_{\hat{k}(x_0)}(x_0)|}{||\textbf{w}_{\hat{l}(x_0)}-\textbf{w}_{\hat{k}(x_0)}||_2^2}(\textbf{w}_{\hat{l}(x_0)}-\textbf{w}_{\hat{k}(x_0)})$
如果是迭代则公式变为如下：

P=⋂k=1c{x:fk(xi)−fk^(x0)(xi)+▽fk(xi)⊤x−▽fk^(x0)(xi)⊤x≤0} P = ⋂ k = 1 c { x : f k ( x i ) − f k ^ ( x 0 ) ( x i ) + ▽ f k ( x i ) ⊤ x − ▽ f k ^ ( x 0 ) ( x i ) ⊤ x ≤ 0 }

$P=\bigcap\limits_{k=1}^{c}\{x:f_{k}(x_i)-f_{\hat{k}(x_0)}(x_i)+\bigtriangledown f_{k}(x_i)^{\top}x -\bigtriangledown f_{\hat{k}(x_0)}(x_i)^{\top }x\leq 0 \}$

小结

由线性推广到非线性也一样，文章还给出了由2范数推广到 $l_{p}$ 范数，以及和FGSM算法的实验对比，有兴趣的可以详细看原文。

代码

在cleverhans团队给的demo上修改了一下，可以下载运行mnist数据集进行测试，如果想测试其他数据集或者有任何问题，我们都可以随时探讨。在原库中有些bug或者版本兼容问题已经修改，utils_tf.py中训练是可能会遇到shape不匹配问题。将输入reshape一下就可以了。
下载地址：DeepFool对抗算法
注：依赖cleverhans集成库，或是我资源中的FGSM算法也可以。
cleverhans_github地址：https://github.com/tensorflow/cleverhans