卷积的几个基本定义
卷积核大小(Kernel Size): 卷积核的大小定义了卷积的视图范围。二维的常见选择大小是3,即 3×3像素。
卷积核的步长(Stride): Stride 定义了内核的步长。虽然它的默认值通常为 1,但我们可以将步长设置为 2,然后对类似于 MaxPooling 的图像进行向下采样。
边缘填充(Padding): Padding 用于填充输入图像的边界。一个(半)填充的卷积将使空间输出维度与输入相等,而如果卷积核大于 1,则未被填充的卷积将会使一些边界消失。
输入和输出通道: 一个卷积层接受一定数量的输入通道(I),并计算一个特定数量的输出通道(O),这一层所需的参数可以由 I*O*K 计算,K 等于卷积核中值的数量。
卷积网络类型分类
普通卷积
扩张卷积
又名带洞的(atrous)卷积,扩张的卷积引入了另一个被称为扩张率(dilation rate)的卷积层。这定义了卷积核中值之间的间隔。一个 3×3 卷积核的扩张率为 2,它的视图与 5×5 卷积核相同,而只使用 9 个参数。想象一下,取一个 5×5 卷积核,每两行或两列删除一行或一列。
这将以同样的计算代价提供更广阔的视角。扩张的卷积在实时分割领域特别受欢迎。如果需要广泛的视图,并且不能负担多个卷积或更大的卷积核,那么就使用它们。