第一章 卷积神经网基本组成
1.1
输入层
在图像分类工作中,输入层通常能批量进行训练的图像数量取决于计算机硬件设备的能力、能够存储数据的大小以及模型的具体结构。网络的输入层图像尺寸通常是三维的图像,假设输入层接收到的图像数量为 N
,图像的长和宽分别是
H
和
W
,则输入层的输出数据为 N×H×W×3
。如果使用一个典型的神经网络模型,必须把整个图像读入神经网络模型,也就是完全连接模式。当图像大小较大时,连接参数的数量就会增加,这就需要大量的计算。
1.2
卷积层
卷积层的功能是用于获取图像的隐藏信息。例如,给出一个新的图像,卷积神经网 络不能确切地知道这些特征需要匹配原始图的哪一部分,所以它会尝试原始图中每一个可能的位置。这种对应图像位置的像素匹配就是卷积的一种运算。卷积就是在原始图像中计算一个特征及其对应小块的结果。只需将两个小块中相应位置的像素值相乘,然后将整个小块的相乘结果相加即可。它是通过一定程度的卷积核矩阵把原始数据中隐含的相关性进行抽象化。