PyTorch: Conv2d and ConvTranspose2d

最新推荐文章于 2025-10-21 15:03:50 发布

原创

最新推荐文章于 2025-10-21 15:03:50 发布 · 2.1w 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#AI #PyTorch #GAN #CNN

本文介绍了PyTorch中的ConvTranspose2d如何实现Conv2d的逆过程，详细阐述了计算dx的方法，并探讨了在设置padding和output_padding时的注意事项，以在CNN GAN中正确应用ConvTranspose2d。

ConvTranspose2d 实现的是 Conv2d 的逆过程，也就是将一张 $\times m$ 的图片，upsampling 到 $\times n$ ，这里 $n > m$ 。 ConvTranspose2d 的实现方法，与 Assignment 2 | ConvolutionalNetworks 计算 dx 的方法完全相同。实际上，不论在 PyTorch 还是在 TensorFlow 里面，ConvTranspose2d 的实现和计算 dx 的梯度的实现，使用的是同一段代码。在 PyTorch 的文档里明确说明了这一点：

This module can be seen as the gradient of Conv2d with respect to its input.

这里先把 Conv2d 中计算 dx 的方法写一下：

dx 的计算方法

这里写出 dx 和 dw 的闭式解很复杂，而且不容易写出代码，所以这里用一个例子来推出 dx 和 dw 的计算过程，根据此计算过程可以将代码写出。这里 stride = 1，pad = 0，x，w，y为：
$\begin{bmatrix} x_{11}& x_{12}& x_{13}\newline x_{21}& x_{22}& x_{23}\newline x_{31}& x_{32}& x_{33} \end{bmatrix}, \quad w = \begin{bmatrix} w_{11}& w_{12}\newline w_{21}& w_{22} \end{bmatrix}, \quad y = \begin{bmatrix} y_{11}& y_{12}\newline y_{21}& y_{22} \end{bmatrix}$
将 $\times w$ 展开：
$\begin{aligned} y_{11} &= w_{11}x_{11} + w_{12}x_{12} + w_{21}x_{21} + w_{22}x_{22} \newline y_{12} &= w_{11}x_{12} + w_{12}x_{13} + w_{21}x_{22} + w_{22}x_{23} \newline y_{21} &= w_{11}x_{21} + w_{12}x_{22} + w_{21}x_{31} + w_{22}x_{32} \newline y_{22} &= w_{11}x_{22} + w_{12}x_{23} + w_{21}x_{32} + w_{22}x_{33} \newline \end{aligned}$

最低0.47元/天解锁文章