1.概念
卷积核(Kernel):即一个n*n的矩阵,常用的2*2、3*3、5*5等,即下图灰色部分的大小(每次即用该卷积核计算原特征图(蓝色部分)的内容,然后将值写入到新的特征图(绿色部分))。
步长(Stride):卷积遍历特征图时,每次要移动的步长,即下图每次移动的步长。
填充(Padding):即会不会扩大计算的边缘,即下图的白色边缘部分。如果不填充,那么输出的特征图(绿色部分)尺寸会小于原始特征图(蓝色部分)。对边界进行填充,输出的特征图(绿色部分)同原始的特征图(蓝色部分)尺寸相同。
下图:二维卷积。卷积核(3*3),步长(1),填充(1)。

通道(Channel):卷积层的通道数(层数)。
如下图:彩色图像(多通道)有rgb三个通道,每个通道使用不同的卷积核进行计算,算出每个分量的特征图之后,再将三个分量合并成新的彩色图像特征图(多通道)。
图1:使用不同的卷积核计算彩色图像的通道。

图2:使用将三个通道合并为一个新的彩色图像。

2.计算过程
卷积核对应在原始特征图上,将卷积核与原始特征图对应位置的数值逐个相乘,然后整个卷积核的值求和汇总,即得到该位置的卷积结果。按照设定的步长,移动卷积核从头部到尾部,将所算出的卷积结果输入到特征图中,得到最终结果。
下图:卷积核计算过程(未填充,新特征图尺寸小于原始特征图)

3.拓展
三维卷积(3D Convolution):(联想点云高斯滤波),卷积核为n*n*n的三维卷积核,原理同二维,计算得值。

1x1卷积(1 x 1 Convolution):三维使用1*1计算之后,三维变成二维。用于降维,减少计算复杂度。

反卷积(转置卷积)(Deconvolution / Transposed Convolution):对特征图进行上采样,一般用于将卷积计算后的特征图尺寸变换为和原始尺寸一致(相当于还原特征图尺寸,但是还原后特征图的值不一定和卷积计算得出的值相同)。
如下图,待转置的特征图2*2(绿色部分),使用3*3的卷积核进行转置卷积,上采样之后的输出特征图大小4*4。


1627

被折叠的 条评论
为什么被折叠?



