3维数据的卷积运算
通道方向上有多个特征图时,会按通道进行输入数据和滤波器的卷积运算,并将结果相加。
把三维数据表示多维数组时,书写顺序为(channel,height,width),即(C,H,W)。滤波器可以写成(C,FH,FW).对于要在通道方向拥有多个卷积运算的输出,需要用到多个滤波器(权重),通过应用FN个滤波器,输出特征图也生成了FN个。对于偏置,偏置的形状是(FN,1, 1)。
池化层
池化是缩小高、长方向上的空间的运算,缩小空间大小。
Max池化是获取最大值的运算,如下
除了 Max 池化之外,还有 Average 池化等。相对于 Max 池化是从目标区域中取出最大值Average 池化则是计算目标区域的平均值。在图像识别领域,主要使用 Max 池化。经过池化运算,输入数据和输出数据的通道数不会发生变化。池化对微小的位置变化具有鲁棒性(健壮)
卷积层与池化层的实现


卷积层和池化层是图像识别中必备的模块,卷积层的滤波器会提取边缘或斑块等原始信息。
LeNet:
有多个卷积层和池化层,最后经由全连接层输出结果。激活函数使用ReLU,使用进行局部正规化的LRN层(对局部神经元的活动创建竞争机制,使得其中响应比较大的值变得相对更大,并抑制其他反馈较小的神经元,增强了模型的泛化能力),使用Dropout(防止过拟合)。
总结:
1.cnn新增卷积层和池化层
2.使用im2col函数实现卷积层和池化层
3.通过CNN的可视化,可知随着层次变深,提取的信息愈加高级。
4.LenNet和AlexNet是cnn代表性网络