转置卷积/反卷积

转置卷积又称反卷积,逆卷积。在主流的深度学习框架之中,如Tensorflow,Pytorch,Kreas中的函数名都是conv_transpose

将一个4*4的输入通过3*3的卷积核核进行普通卷积后(无padding,stride=1),将得到2*2的输出。而转置卷积将一个2*2的输入通过同样的3*3的卷积核,将得到一个4*4的输出。这看起来像是普通卷积的逆过程。事实上,这两者没有任何关系,操作过程也是不可逆的。

普通卷积(直接卷积)

但在实际计算中,并不是通过卷积核在输入上进行滑动计算,效率太低,而是将卷积核转换为等效矩阵,将输入转化为向量,通过输入向量核卷积核矩阵的相乘获得输出向量。输出的向量经过整形便可得到我们的二维输出特征。

具体操作如下图所示,由于一个3*3的卷积核要在输入上不同位置卷积卷积4次,所以通过补0的方式,将卷积核分别置于一个4*4矩阵的四个角落,这样我们的输入可以直接和这四个4*4的矩阵进行卷积,而舍去了滑动操作。

进一步我们将输入拉成长向量,四个4*4的卷积核也进行拼接,如下图

我们记向量化的图像为  , 向量化的卷积矩阵为 [公式] ,输出特征向量为 [公式]

 

 

我们将一个1*16的行向量乘以一个16*4的矩阵,得到一个1*4的行向量,那么反过来一个1*4的向量乘以一个4*16的矩阵不就是能得到一个1*16的行向量,这既是转置卷积的思想。

转置卷积

一般卷积操作(这里只考虑最简单的无padding,stride=1的情况),都将输入的数据越卷越小,根据卷积核大小的不同,和步长的不同,输出尺寸变化也很大。但是有时候,我们需要输入一个小的特征,输出更大的尺寸的特征。比如,图像语义分割中,往往要求最终的输出的特征尺寸和原始的输入尺寸相同,但是在网络卷积核池化的过程中特征图的尺寸逐渐变小,这里转置卷积便能派上用场。在数学上,转置卷积的操作非常简单,把正常的卷积操作反过来即可。

这里需要注意的是,这两个操作并不是可逆的,对于用一个卷积核,经过转置卷积操作后并不能恢复到原始的数值,只是保留了原始的形状

形象化的转置卷积

可视化转置卷积,以上式的第一列为例

这里将输入还原为一个2*2的张量,新的卷积核由于左上角有非零值,可以计算得到右侧结果

对每一个列向量都可以做这样的变换

结合整体,仿佛是有一个更大的卷积核在2*2的大小的输入上滑动,但是输入太小,每一次卷积只能对应卷积核的一部分

直接卷积是用一个小窗户看大世界,而转置卷积是用一个大窗户的一部分去看小世界。

这里需要注意。我们定义的卷积是左上角为a,右下角为i,但是在可视化卷积的过程中需要将卷积核旋转180度 后再进行卷积。由于输入图像太小,我们按照卷积核的尺寸来进行补0操作,补0数量为0即3-1,这样就将一个转置卷积转换为对应的直接卷积

总结一下转置卷积转换为直接卷积的步骤(这里只考虑stride=1 padding=0的情况)

设卷积核大小为k*k,输入为方形矩阵

(1)对输入进行四边补0,单边补0的数量为k-1

(2)将卷积核旋转180度,再新的输入上进行直接卷积

# -*- coding: utf-8 -*-
# @Author  : qiaohezhe
# @github : https://github.com/fengduqianhe
# @Date    :  2020/1/23 12:41
# version: Python 3.7.8
# @File : tensorflow_example6.py
# @Software: PyCharm
#转置卷积的验证例子


import tensorflow as tf

x = tf.reshape(tf.constant([[1,2],
                            [4,5]],dtype=tf.float32), [1, 2, 2, 1])
kernel = tf.reshape(tf.constant([[1,2,3],
                                 [4,5,6],
                                 [7,8,9]],dtype=tf.float32), [3, 3, 1, 1])
transpose_conv = tf.nn.conv2d_transpose(x, kernel, output_shape=[1, 4, 4, 1], strides=[1,1,1,1], padding='VALID')
sess = tf.Session()
print(sess.run(x))
print(sess.run(kernel))
print(sess.run(transpose_conv))


x2 = tf.reshape(tf.constant([[0, 0, 0, 0, 0, 0],
                             [0, 0, 0, 0, 0, 0],
                             [0, 0, 1, 2, 0, 0],
                             [0, 0, 4, 5, 0, 0],
                             [0, 0, 0, 0, 0, 0],
                             [0, 0, 0, 0, 0, 0]],dtype=tf.float32), [1, 6, 6, 1])
kernel2  = tf.reshape(tf.constant([[9,8,7],
                                   [6,5,4],
                                   [3,2,1]],dtype=tf.float32), [3, 3, 1, 1])
conv = tf.nn.conv2d(x2,kernel2,strides=[1,1,1,1],padding='VALID')

print(sess.run(x2))
print(sess.run(kernel2))
print(sess.run(conv))

引用学习:

优快云-专业IT技术社区-登录​blog.youkuaiyun.com/tsyccnh/article/details/87357447

<think>好的,我需要回答用户关于转置卷积反卷积的区别及应用场景的问题。首先,我得回顾一下用户提供的引用内容,特别是引用[2]引用[3],因为这两个引用直接提到了这两个概念。 根据引用[2],反卷积(Deconvolution)这个术语最早出现在Zeiler的论文中,用于神经网络的可视化。而转置卷积(Transposed Convolution)分数步长卷积(Fractional Strided Convolution)是反卷积的其他名称。这里似乎指出转置卷积反卷积是同一个概念的不同叫法,但用户的问题是关于它们的区别,所以可能存在需要澄清的地方。 接下来,引用[3]提到,反卷积CNN可视化中实际上是卷积转置操作,而不是数学上的逆运算。同时,转置卷积在这里被用作上采样的一种方法,比如在图像分割或生成模型中。这暗示转置卷积可能更多是指技术实现中的转置操作,而反卷积可能是一个更广泛的概念,但有时候被混用。 我需要明确区分这两个术语。根据我的知识,转置卷积在数学上是通过对卷积核进行转置并使用步长来扩大输入尺寸的操作,而反卷积在数学上本应是卷积的逆运算,但在深度学习中通常指的是转置卷积。可能存在术语的混淆,需要指出这一点。 应用场景方面,引用[3]提到了三个方面:无监督学习中的稀疏编码、CNN可视化上采样。转置卷积主要用于上采样生成模型,而反卷积在文献中有时可能指不同的操作,但实际使用中两者常被混用。 因此,我的回答需要明确: 1. 转置卷积反卷积深度学习中的常见用法,指出它们的区别更多是术语上的,但有时可能有不同含义。 2. 转置卷积的具体数学操作应用场景。 3. 反卷积在数学上的原始意义与深度学习中的实际应用的区别。 4. 应用场景如生成模型、图像分割等。 需要确保回答结构清晰,分点说明概念、区别应用场景,并正确使用LaTeX格式,引用用户提供的引用内容,并在末尾添加相关问题。</think>### 转置卷积反卷积的区别及应用场景 #### 1. **基本概念** - **转置卷积(Transposed Convolution)** 是一种通过调整卷积核的排列方式实现输入特征图尺寸放大的操作。数学上,其核心是**对标准卷积的矩阵运算进行转置**。例如,标准卷积的矩阵形式为$Y = WX + b$,则转置卷积可表示为$X' = W^T Y'$。它通过填充(padding)步长(stride)的调整实现上采样,常用于图像生成或分割任务[^2][^3]。 - **反卷积(Deconvolution)** 在数学上本应指卷积运算的逆运算(即解卷积),但在深度学习中这一术语常被**误用**为转置卷积的同义词。例如,Zeiler在CNN可视化中使用的“反卷积”实质是转置卷积操作,而非数学上的逆运算[^2][^3]。 #### 2. **核心区别** | 特性 | 转置卷积 | 反卷积(数学定义) | |---------------------|-----------------------------------|-----------------------------------| | **数学本质** | 卷积核的转置运算 | 严格意义上的卷积逆运算 | | **实现目标** | 上采样或特征图尺寸放大 | 从输出恢复原始输入信号 | | **深度学习中的应用**| 广泛用于生成模型、图像分割等任务 | 极少直接使用,多被转置卷积替代 | #### 3. **应用场景** - **转置卷积的典型应用** - **图像生成**:如GAN中生成高分辨率图像,通过转置卷积逐步扩大特征图尺寸。 - **语义分割**:在U-Net等模型中,通过转置卷积恢复空间分辨率以实现像素级预测。 - **特征可视化**:将深层特征映射回像素空间,解释网络的学习模式[^3]。 - **反卷积的原始意义** 数学上的反卷积在信号处理中用于去模糊或消除卷积效应,但在深度学习中几乎不直接应用,仅作为术语与转置卷积混淆使用[^2][^3]。 #### 4. **实现对比** - **转置卷积的步长与填充** 若标准卷积的步长为$s$,转置卷积通过插入$s-1$个零实现输入扩大。例如,输入尺寸为$n$,输出尺寸为$n' = s(n-1) + k$($k$为卷积核大小)[^3]。 - **代码示例(PyTorch)** ```python import torch.nn as nn # 转置卷积层:输入通道1,输出通道1,核大小3,步长2 transposed_conv = nn.ConvTranspose2d(1, 1, kernel_size=3, stride=2) ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值