反卷积/转置卷积 (Deconvolution/Transposed Convolution) 原理与计算方法

最新推荐文章于 2025-04-02 19:47:39 发布

BeringStrait_

最新推荐文章于 2025-04-02 19:47:39 发布

阅读量853

点赞数 9

分类专栏： Tutorials 文章标签： pycharm python

本文链接：https://blog.youkuaiyun.com/qq_51954707/article/details/135429198

版权

Tutorials 专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了反卷积的原理，它是卷积的逆过程，用于图像上采样。文章讨论了棋盘现象的出现原因，并提出了两种方法来避免或减轻这个问题：使用可被步长整除的卷积核和利用插值调整图像大小。特别提到了TensorFlow中的`tf.image.resize_images`函数及其不同插值方法的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

反卷积

Deconvolution/Transposed Convolution
来自文章《A guide to convolution arithmetic for deep learning》与《Deconvolution and Checkerboard Artifacts》

反卷积是一种上采样方法，将原图像分辨率提高，deconvolution layer可以允许模型通过每一个点进行绘制高分辨率图像上的一个方块。
在进行一般的卷积时，可以看作一种矩阵运算，将一个3x3的卷积核kernel展开成如下的矩阵形式：

我们称该矩阵为C，则如果输入某图像，首先将图像展平为一个向量，之后与C进行矩阵乘法：

此时得到的便是卷积后缩小的图像，也就是进行卷积的前向传播时进行的运算。而计算梯度反向传播时，则将loss x CT（转置），即kernel定义了用于前向和后向传递的矩阵C和CT。

对于反卷积的情况，则是与卷积正好相反，其前向和后向通过分别乘以CT和(CT)T = C来计算。
图中可以看出，CT乘以2x2的输入矩阵，得到了4x4的输出，与刚才的情况恰好转置，因此拥有相同kernel的卷积和反卷积是正好相反的：

但当卷积核大小不能被步长整除的时候，会出现棋盘现象。原因是上采样过程中取样不均匀，生成图的某些点在原图中多次取样（这不是反卷积特有的情况，只是在反卷积时由于图像分辨率提升导致更为明显）

方法一：采取可以被stride整除的kernel size
该方案较好的应对了棋盘效应问题，但是仍不够圆满，因为一旦我们的kernel学习不均匀，仍然会产生棋盘效应，（下图为步长为2，核大小为4所产生的现象）
方法二：插值
调整图像大小（使用最近邻插值或双线性插值），然后执行卷积图层。这似乎是一种自然的方法，大致相似的方法在图像超分辨率方面表现良好

插值是指在给定函数值的情况下，对某个空间中的非给定点进行函数值近似的问题。在深度学习中常用在修改图像尺寸的过程，由旧的图像矩阵中的点计算新图像矩阵中的点并插入，不同的计算过程就是不同的插值算法。