卷积神经网络中有四个主要操作:
1.卷积
2.非线性变换(ReLU)
3.池化或子采样
4.分类(完全连接层)
卷积的主要目的是从输入图像中提取特征。通过使用输入数据中的小方块来学习图像特征,卷积保留了像素间的空间关系。
过滤器就是原始输入图像的特征检测器。
池化的作用是逐步减少输入的空间大小[4]。具体来说有以下四点:
使输入(特征维度)更小,更易于管理
减少网络中的参数和运算次数,因此可以控制过拟合 [4]
使网络对输入图像微小的变换、失真和平移更加稳健(输入图片小幅度的失真不会改池化的输出结果 —— 因为我们取了邻域的最大值/平均值)。
可以得到尺度几乎不变的图像(确切的术语是“等变”)。这是非常有用的,这样无论图片中的物体位于何处,我们都可以检测到,(详情参阅[18]和[19])
https://www.plob.org/article/16273.html