Group Equivariant Convolutional Networks

最新推荐文章于 2025-01-04 10:24:51 发布

kiyoxi

最新推荐文章于 2025-01-04 10:24:51 发布

阅读量1.4k

点赞数 2

分类专栏：神经网络

神经网络专栏收录该内容

8 篇文章

订阅专栏

本文探讨了传统卷积神经网络(CNN)的平移不变性和缺乏旋转不变性的问题，并介绍了一种新型网络——群组等变卷积网络(G-CNN)。通过对CNN卷积过程的数学推导，揭示了其内在特性，并提出了改进方案以实现旋转不变性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Group Equivariant Convolutional Networks

Cohen T, Welling M. Group equivariant convolutional networks[C]//International conference on machine learning. 2016: 2990-2999.
https://github.com/tscohen/gconv_experiments

传统的卷积具有平移不变性（translation symmetry）：对输入图片进行平移后再输入网络，得到的输出与未平移的输出仍然满足平移关系

提取不变性的数学表达式：
在这里插入图片描述
x表示输入， $T_g$ 表示变换， $\Phi$ 表示特征提取过程（即卷积过程），上式的含义是输入x经过平移变换得到 $T_gx$ ，对 $T_gx$ 提取特征，等价于：直接对x提取特征再进行 $T_g'$ 变换。对于平移不变性而言，这边的变换 $T_g$ 和 $T_g'$ 等价，均为平移变换。

进一步理解不变性：
在这里插入图片描述根据上图，有两张脸x和y，两者经过特征提取之后映射到同一个点 $\Phi(x)=\Phi(y)$ ，假设对这两张脸进行变换 $T_g^1$ ，得到旋转后的脸 $T_g^1x$ 和 $T_g^1y$ ，再进行特征提取，得到 $\Phi(T_g^1x)$ 和 $\Phi(T_g^1y)$ ，根据变换不变性： $\Phi(T_gx)=T_g'\Phi(x)$ ，有：

$\Phi(T_g^1x)=T_g^2\Phi(x)$

$\Phi(T_g^1y)=T_g^2\Phi(y)$

又因为 $\Phi(x)=\Phi(y)$ ，所以得到 $\Phi(T_g^1x)=\Phi(T_g^1y)$ ，即：旋转之后再提取特征，两张脸还是能够被映射到同一个点，即具有旋转不变性

那么，为什么传统的CNN会具有平移不变性呢？ 作者对此进行了如下推导：
首先传统CNN的卷积过程可以表示为：
在这里插入图片描述

上面的式子表示卷积，下面的式子表示相关（correlation），两者应用于CNN时从训练结果上讲是等价的。x表示坐标，f表示特征图， $l$ 表示第 $l$ 层， $K^l$ 表示通道数， $\psi$ 表示卷积核，上式表现了一个卷积核 $\psi$ 在特征图上卷积的过程。

那么，假设对输入的特征图f做位移： $y\rightarrow y+t$ ，可以得到以下推导过程：
在这里插入图片描述

$L_t$ 表示进行位移t的变换，上式表明：先对特征图f进行位移t的变换再通过卷积核 $\psi$ 提取特征，等价于：先通过卷积核 $\psi$ 提取特征，再进行位于t的变换。由此，得到位移不变性。

那么，为什么传统的CNN没有旋转不变性呢？ 作者进行了对应的旋转变换的推导证明 $[[L_rf]*\psi](x) = L_r[f*[L_{r^{-1}}\psi]](x)$ :

$[[L_rf]\star\psi](x) =\sum_{y}f(A_ry)\psi(y-x)=\sum_{y}f(y)\psi(A^{-1}_ry-x)=\sum_{y}f(y)\psi(A^{-1}_r(y-A_rx))=L_r[f\star[L_{r^{-1}}\psi]](x)$

其中， $A_r$ 表示旋转矩阵。
直观上理解，若对特征图进行旋转之后再进行卷积，等价于：对卷积核做反向的旋转，再对原始特征图进行卷积，再把卷积得到的结果旋转回来。这与不变性的定义不符（按照不变性的定义，应该是等价于：特征图直接与卷积核卷积，再进行旋转），因此，传统的CNN没有旋转不变性。

以下是脑洞（存在问题）：
假设我们定义一个新的卷积操作：
$[f\diamond\psi^i](\theta)=\sum_{y\in \mathbb{Z}^2}\sum_{k=1}^{K^l}f_k(y)\psi_k^i(A_\theta^{-1} y)$
其中， $A_\theta$ 表示旋转角度为 $\theta$ 的旋转矩阵。
根据这个卷积操作，推导旋转不变性：
$[[L_rf]\diamond\psi](\theta) =\sum_{y}f(A_ry)\psi(A_\theta^{-1} y)=\sum_{y}f(y)\psi(A^{-1}_rA_\theta^{-1} y)=\sum_{y}f(y)\psi(A_{(\theta+r)}^{-1} y)=L_r[f\diamond\psi](\theta)$