在cv领域,卷积神经网络已经是每个cv人必会的网络结构之一,今天就基于Pytorch框架中的Conv2d()来讲讲卷积操作。
在pytoch中,Tensor的维度是[batch_size,channel,Height,Width] 即 [B,C,H,W]。查阅Pytoch的官方文档,Conv2d的参数有:
我们只关心前3个参数。
(1)in_channels是输入张量的通道数,下图中的in_channels=3,
(2)out_channels是输出张量的通道数,这个参数实际上指的是据卷积核的个数,即最后输出的张量的通道数。
(3)kernel_sizes是卷积核的尺寸,因为卷积核的维度必须和你输入张量的维度一致,故这里只需要输入你想要的卷积核的尺寸即可。卷积核的初始值可以自己定义,如果没有自己定义,Pytorch也会自动随机初始化。
(4)至于stride和padding这里就不细讲了。
这里我们的输入是(1,3,3,3),卷积核是(2,3,2,2) 得到输出是(1,2,2,2)
用代码实现一下
import torch
from torch import nn
input = torch.ones(1,3,3,3)
class Conv(nn.Modul