pytorch 中 反卷积(转置卷积) 输入特征图尺寸计算

转载自:

https://zhuanlan.zhihu.com/p/39240159

 

pytorch中反卷积的函数为:

class torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, 
                                                       output_padding=0, groups=1, bias=True, dilation=1)

参数的含义如下:

  • in_channels(int) – 输入信号的通道数
  • out_channels(int) – 卷积产生的通道数
  • kerner_size(int or tuple) - 卷积核的大小
  • stride(int or tuple,optional) - 卷积步长,即要将输入扩大的倍数。
  • padding(int or tuple, optional) - 输入的每一条边补充0的层数,高宽都增加2*padding
  • output_padding(int or tuple, optional) - 输出边补充0的层数,高宽都增加padding
  • groups(int, optional) – 从输入通道到输出通道的阻塞连接数
  • bias(bool, optional) - 如果bias=True,添加偏置
  • dilation(int or tuple, optional) – 卷积核元素之间的间距

对于每一条边输入输出的尺寸的公式如下:

output = (input - 1)*stride+outputpadding - 2*padding+kernelsize

### 转置卷积层的输出尺寸计算PyTorch 中,转置卷积层(也称为反卷积层或上采样层)用于增加特征图的空间维度。其输出大小取决于多个因素,包括输入张量的尺寸、内核大小、步幅、填充等。 对于二维转置卷积操作 `nn.ConvTranspose2d` 的输出尺寸可以通过下面给出的公式来预测: \[ H_{\text{out}} = (H_{\text{in}} - 1) \times \text{stride}[0] - 2 \times \text{padding}[0] + \text{dilation}[0] \times (\text{kernel\_size}[0] - 1) + \text{output\_padding}[0] + 1 \] \[ W_{\text{out}} = (W_{\text{in}} - 1) \times \text{stride}[1] - 2 \times \text{padding}[1] + \text{dilation}[1] \times (\text{kernel\_size}[1] - 1) + \text{output\_padding}[1] + 1 \][^3] 其中: - \( H_{\text{in}}, W_{\text{in}} \): 输入的高度和宽度; - stride, padding, dilation 和 kernel_size 是对应的超参数列表; - output_padding 参数允许调整输出形状,在某些情况下使它匹配预期目标。 为了更好地理解这些概念并验证上述公式的准确性,可以创建一个简单的例子来进行测试。这里展示了一个 Python 函数,该函数接受必要的参数作为输入,并返回预计的输出高度和宽度。 ```python def get_transpose_conv_output_shape(input_h_w, out_channels, in_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, dilation=1): """ 计算给定配置下的 nn.ConvTranspose2d 输出 shape :param input_h_w: tuple(int,int), 输入图像高宽 :return: tuple(int,int),输出图像高宽 """ h_in, w_in = input_h_w k_h, k_w = kernel_size if isinstance(kernel_size, tuple) else (kernel_size,) * 2 s_h, s_w = stride if isinstance(stride, tuple) else (stride,) * 2 p_h, p_w = padding if isinstance(padding, tuple) else (padding,) * 2 op_h, op_w = output_padding if isinstance(output_padding, tuple) else (output_padding,) * 2 d_h, d_w = dilation if isinstance(dilation, tuple) else (dilation,) * 2 height_out = ((h_in - 1) * s_h - 2 * p_h + d_h * (k_h - 1) + op_h + 1) width_out = ((w_in - 1) * s_w - 2 * p_w + d_w * (k_w - 1) + op_w + 1) return height_out, width_out # 测试案例 input_height_width = (6, 6) conv_t_params = { 'out_channels': 8, 'in_channels': 4, 'kernel_size': 3, 'stride': 2, 'padding': 1, 'output_padding': 1, } print(get_transpose_conv_output_shape( input_height_width, **conv_t_params)) ``` 此代码片段定义了辅助函数 `get_transpose_conv_output_shape()` 来帮助用户快速估算特定条件下转置卷积后的输出尺寸
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值