引言
如果用全连接神经网络处理大尺寸图像具有三个明显的缺点:
(1)首先将图像展开为向量会丢失空间信息;
(2)其次参数过多效率低下,训练困难;
(3)同时大量的参数也很快会导致网络过拟合。
而使用卷积神经网络可以很好地解决上面的三个问题
01
卷积网络通俗理解
卷积网络的核心,当然是卷积。在CNN(卷积网络)的卷积层中,存在着一个个填充数据的正方形“盒子”就是我们说的卷积核。
上篇学到神经网络,了解了网络的输入与输出。在CNN网络中,原始图片经过输入层后,会变成灰度或者RGB数据矩阵。
将卷积核与图片数据矩阵对齐,对应的各自中的数据相乘后再相加卷积核在图像上以一定的距离移动运算,这就是步长。
得到的新矩阵能反映图像的部分特征,被称为特征图,它们既是这层的输出,也是下一层的输入。
02
特殊卷积---池化Pooling(选取图像的主要特征)
最大池化:取区域最大值。Maxpooling保留图片的纹理信息
最小池化;取区域最小值
平均池化:取区域平均值。保留图片更多的背景信息。
03
卷积计算
(1)计算公式
卷积计算公式如下:
公式1
式中参数:
i--输入尺寸;
o---输出尺寸;
p---padding;
K--- kernel_size;
s---stride。
(2)计算实例
输入图片:假设一张7*7的图片,如下图:
卷积核大小:假设一张3*3(k=3)的卷积核,如下图:
参数设置: 步长S=2;p=0---舍弃
计算过程: [(7+2*0-3)/2}+1 =3
输出图片:输出的图像为3*3
计算过程:
总体过程如下