卷积神经网络架构解析
一、卷积层堆叠
卷积层通常接收形状为 [batch, height, width, channels] 的 4D 张量作为输入,并输出另一个 4D 张量。为简化理解,我们在图示中忽略批次维度,仅关注单个 [height, width, channels] 的 3D 图像。
卷积层将数据“立方体”转换为另一个数据“立方体”,这些卷积层可以堆叠使用。例如,第一个卷积层使用 3x3 滤波器处理具有四个通道的输入数据,滤波器以不同的权重应用于输入六次,产生六个通道的输出值。接着,这些输出值被输入到使用 2x2 滤波器的第二个卷积层,该层应用滤波器时步长为 2,以在水平平面上获得更少的输出值。
二、池化层
卷积层中应用的滤波器数量决定了输出的通道数,但如何控制每个通道中的数据量呢?神经网络的目标通常是从包含数百万像素的输入图像中提取信息,将其归纳为少数几个类别。因此,我们需要能够组合或下采样每个通道中信息的层。
- 最大池化和平均池化
- 最常用的下采样操作是 2x2 最大池化,即对于通道中每四个输入值的组,仅保留最大值。平均池化则类似,不过是对这四个值取平均值。
- 最大池化和平均池化层没有可训练的权重,它们纯粹是用于调整大小的层。
- 池化层与卷积层的协同作用
- 卷积层是一系列可训练的滤波器,训练后每个滤波器专门匹配特定的图像特征。最大池化层仅保留检
超级会员免费看
订阅专栏 解锁全文
1377

被折叠的 条评论
为什么被折叠?



