GoogLeNet是一个深度卷积神经网络架构,首次在2014年由Google团队在ImageNet比赛中提出,并且以其成功而著称。它的主要特点包括:
1. Inception模块
- GoogLeNet引入了Inception模块,这是一种创新的层结构,允许网络在同一层中进行多种类型的卷积操作。这种模块包括不同大小的卷积核(如1x1、3x3、5x5)和池化层,使得网络能够提取多尺度的特征。
- 通过使用1x1卷积,网络不仅可以进行特征的维度减少,还可以增加网络的非线性能力。
2. 网络深度
- GoogLeNet有22层(不包括输入层和输出层),比之前的网络(如AlexNet和VGGNet)更深。网络的深度使其能学习更复杂的特征。
3. 使用全局平均池化
- 在GoogLeNet的输出层,使用全局平均池化(Global Average Pooling)代替全连接层。这种方式减少了参数数量,降低了过拟合的风险,同时还使得模型对输入图像的空间变形具有更好的适应性。
4. 参数效率
- GoogLeNet相对较少的参数数量(约1000万)使其在计算资源有限的情况下表现优越。相比于同类模型,它在准确率和效率之间取得了良好的平衡。
5. 多路径学习
- Inception模块的设计允许不同的路径同时学习,网络可以选择性地关注不同的特征,从而增强了特征提取的能力。