GoogLeNet：深度学习中的“卷积网络变形金刚“

最新推荐文章于 2025-12-04 14:13:28 发布

原创

最新推荐文章于 2025-12-04 14:13:28 发布 · 791 阅读

CC 4.0 BY-SA版权

文章标签：

大家好！今天我们要聊一个在深度学习领域掀起革命的经典网络——GoogLeNet（又称Inception v1）。这个由Google团队在2014年提出的模型，不仅拿下了ImageNet竞赛冠军，更用"网络中的网络"设计理念彻底改变了卷积神经网络（CNN）的架构思路。

在GoogLeNet之前，主流思路是不断增加网络深度（层数）来提升性能。AlexNet（8层）、VGG（16-19层）都是这一思路的代表。但层数增加带来三大问题：

GoogLeNet的解决之道是：“宽”而非“深”。它通过Inception模块在同一层级上并行提取多尺度特征，大幅提升特征表达能力而不显著增加计算量。

GoogLeNet中的基础卷积块叫作Inception块，得名于同名电影《盗梦空间》（Inception）。
Inception块在结构比较复杂。如下图：

Inception块里有4条并行线路。

前3条线路使用窗口大小分别为1×1 、3×3 和5×5 的卷积层来抽取不同空间尺寸下的信息，其中中间2个线路会对输入先做 1×1卷积来减少输入通道数，以降低模型复杂度。

第4条线路则使用 3×3最大池化层，后接1×1 卷积层来改变通道数。
4条线路都使用了合适的填充来使输入与输出的高和宽一致。最后我们将每条线路的输出在通道
维上连结,并向后进行传输。

😱 问题来了：5×5卷积的计算量是3×3的2.78倍！直接并行会导致计算成本剧增。

GoogLeNet的解决方案是在大卷积前插入1×1卷积进行降维：

# 改进后的Inception分支
branch3 = sequential(
    conv1x1(in_channels, ch5x5red),  # 降维：减少通道数
    conv5x5(ch5x5red, ch5x5)         # 正常卷积
)

1×1卷积的三大作用：