卷积运算详解-优快云博客

本文链接：https://blog.youkuaiyun.com/u012418573/article/details/81974733

padding大小计算及卷积后图片大小公式

首先定义输入矩阵为 W×H；
卷积滤波器filter矩阵 F×F，也叫卷积核或其他的名称；
移动步长：stride值 S；
输出宽高：new_width,new_height
padding像素数：P
padding的方式有两种：VALID和SAME。
1、padding = ‘VALID’
new_height = (H – F ) / S + 1（结果向上取整）
new_width = (W – F) / S + 1
VALID方式不会在原有输入的基础上添加新的像素，输出矩阵的大小直接按照公式计算即可，即 P = 0。
2、如果padding = ‘SAME’
new_height = (H – F +P ) / S + 1 = H / S （结果向上取整）
new_width = (W – F +P) / S + 1 = W / S
在高度上需要pad的像素数为
P = (new_height – 1) × S + F - H
根据上式，输入矩阵上方添加的像素数为
$P_{top}$ = P / 2 （结果取整）
下方添加的像素数为
$P_{down}$ = P - $P_{top}$
同理可以求出左右分别添加的像素数。

tf.nn.conv2d是TensorFlow里面实现卷积的函数。

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)
除去name参数用以指定该操作的name，与方法有关的一共五个参数：

第一个参数input：指需要做卷积的输入图像，它要求是一个Tensor，具有[batch, in_height, in_width, in_channels]这样的shape，具体含义是[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]，注意这是一个4维的Tensor，要求类型为float32和float64其中之一

第二个参数filter：相当于CNN中的卷积核，它要求是一个Tensor，具有[filter_height, filter_width, in_channels, out_channels]这样的shape，具体含义是[卷积核的高度，卷积核的宽度，图像通道数，卷积核个数]，要求类型与参数input相同，有一个地方需要注意，第三维in_channels，就是参数input的第四维

第三个参数strides：卷积时在图像每一维的步长，这是一个一维的向量，长度4

第四个参数padding：string类型的量，只能是"SAME","VALID"其中之一，这个值决定了不同的卷积方式（后面会介绍）

第五个参数：use_cudnn_on_gpu:bool类型，是否使用cudnn加速，默认为true

结果返回一个Tensor，这个输出，就是我们常说的feature map，shape仍然是[batch, height, width, channels]这种形式。