1.填充:用于扩充数据尺寸,增加像素,减少输出图像相对于原图的像素损失,提升模型广泛性以及方便图像的形状保持。一边填充总数按照对应对应卷积核的行列分别做:比如行:假如卷积核有k行,则p总=k-1(如果步幅为1,则这样输出输入同型),上下各自k-1/2行填充,列同样。
2.步幅:指定一次读多少格子,比如(3,4),则水平读每次读三格,竖直四格,默认横竖为1.
举例:输入为(8,8),经过
conv2d = nn.Conv2d(1, 1, kernel_size=(3, 5), padding=(0, 1), stride=(3, 4))
输出·为(2,2)