高级卷积神经网络模型深度解析
1. Inception网络概述
Inception网络于2014年推出,当年便赢得了ImageNet挑战赛。此后,作者发布了该架构的多个改进版本。其名称部分源于网络热梗 “We need to go deeper”,与电影《盗梦空间》相关。
Inception网络的设计理念基于图像中物体具有不同尺度这一前提。标准卷积神经网络(CNN)各层单元的感受野大小固定,难以有效检测不同尺度的物体。为解决此问题,Inception网络采用了由Inception块组成的架构。Inception块将输入数据拆分为不同的并行路径,每个路径包含不同大小滤波器的卷积层或池化层,以对同一输入数据应用不同的感受野,最后将各路径的输出拼接起来。
1.1 Inception v1
Inception v1是GoogLeNet网络架构的一部分,其Inception块有四条路径:
- 1×1卷积,作为输入的一种中继器。
- 1×1卷积后接3×3卷积。
- 1×1卷积后接5×5卷积。
- 步长为1的3×3最大池化。
该块中的层使用填充,使输入和输出具有相同的形状(但深度不同)。同时,为避免输出深度的指数级增长,块中使用1×1卷积来减少各路径的深度,从而降低块的输出深度,这使得构建更深的网络成为可能。
GoogLeNet具有以下特性:
- 与ResNets类似,它从下采样阶段开始,利用两个卷积层和两个最大池化层将输入大小从224×224减小到56×56,然后再进入Inception块。
- 网络包含九个Inception v1块。
- 卷积阶段以全局平均
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



