深入探索GoogLeNet架构:从Inception到MiniGoogLeNet
1. Inception模块及其变体
1.1 原始Inception模块
Inception模块在GoogLeNet中扮演着“多级特征提取器”的角色。它在网络的同一模块内计算1×1、3×3和5×5的卷积。此外,Inception模块还有第四个分支,即池化投影分支,该分支执行步长为1×1的3×3最大池化。历史上,执行池化操作的模型往往能获得更高的准确率,但研究表明,池化层(POOL)可以用卷积层(CONV)替代来减小体积大小。在原始设计中,添加池化层是因为当时认为卷积神经网络(CNN)需要它才能正常工作。池化层的输出会输入到一系列1×1的卷积层中学习局部特征。
最后,Inception模块的四个分支在通道维度上进行拼接。在实现过程中,会通过零填充确保每个分支的输出体积大小相同,以便进行拼接。拼接后的输出将输入到网络的下一层。在实践中,通常会在执行池化操作减小体积大小之前,堆叠多个Inception模块。
1.2 Miniception模块
原始的Inception模块是为在ImageNet数据集上训练GoogLeNet而设计的,该数据集的输入图像尺寸为224×224×3。对于图像空间维度较小、所需网络参数较少的小型数据集,可以简化Inception模块,从而得到Miniception模块。
Miniception模块由卷积模块、Inception模块和下采样模块组成。这些模块组合在一起形成了MiniGoogLeNet架构。
| 模块名称 |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



