CNN中的卷积(Convolution)操作详解
CNN中的卷积层为了能适配NCHW这样的layout,将卷积的参数也设计成4维矩阵的形式,如下图所示(假设batch size = 1)
- h,w分别为卷积核的大小,比如(5,5),(3,3)
- 一个卷积核:定义为(1, C, h, w)这样的格式,C为输入特征图的通道数
- 输入特征图经过一个卷积核后变成1*1*H/s*W/s,其中s为卷积的步长(stride)
- 如果输出通道数为M,则会有M个这样的卷积核(绝大多数情况下这M个卷积核的参数或者说权重都不相同)
- M个输出结果堆叠成1*M*H/s*W/s,形成输出特征图
分组卷积(Group Convolution)操作详解
- 顾名思义,将输入特征图划分成g个组,每组大小为(1*C/g*H*W)
- 每组经过M/g个 C/g * h * w的卷积核,形成(M/g * C *H/s * W/s)的分组输出
- 将每个分组输出堆叠起来(总共有g个组),最终形成M*C*H/s*W/s的输出特征图
深度卷积(DepthWise Convolution)
- 分组卷积中M = C,g=C,即可得到MobileNet中的深度卷积
- 具体操作如下图所示: