为了更清晰地展示 GoogLeNet 中每个卷积层及其相关参数,我们可以将这些信息整理成表格形式。这不仅有助于理解每一层的输入和输出尺寸,还能直观地看到卷积核的数量、大小、步长以及填充方式等关键参数。以下是 GoogLeNet 前几层(包括两个卷积层和两个最大池化层,以及第一个 Inception 模块)的详细参数表。
GoogLeNet 卷积层参数表
层名称 |
类型 |
输入尺寸 |
输出尺寸 |
卷积核尺寸 |
步长 |
填充 |
输入通道数 (Channel) |
输出通道数 (Num) |
备注 |
conv1 |
Conv2d |
224x224x3 |
112x112x64 |
7x7 |
2 |
3 |
3 |
64 |
第一个卷积层,使用7x7的大卷积核,步长为2,填充为3,输出64个通道 |
maxpool1 |
MaxPooling2d |
112x112x64 |
56x56x64 |
3x3 |
2 |
1 |
- |
- |
第一个最大池化层,使用3x3的池化核,步长为2,填充为1 |
conv2 |
Conv2d |
56x56x64 |
56x56x192 |
3x3 |
1 |
1 |
64 |
192 |
第二个卷积层,使用3x3的卷积核,步长为1,填充为1,输出192个通道 |
maxpool2 |
MaxPooling2d |
56x56x192 |
28x28x192 |
3x3 |
2 |
1 |
- |
- |
第二个最大池化层,使用3x3的池化核,步长为2,填充为1 |
inception3a |
Inception Module |
28x28x192 |
28x28x256 |
多个卷积核 |
1 |
1 |
192 |
256 |
第一个Inception模块,包含多个分支,最终输出256个通道 |
Inception 模块 (inception3a
) 详细参数
分支 |
类型 |
输入尺寸 |
输出尺寸 |
卷积核尺寸 |
步长 |
填充 |
输入通道数 (Channel) |
输出通道数 (Num) |
备注 |
branch1 |
Conv2d + ReLU |
28x28x192 |
28x28x64 |
1x1 |
1 |
0 |
192 |
64 |
使用1x1的卷积核进行降维,输出64个通道 |
branch2 |
Conv2d + ReLU + Conv2d + ReLU |
28x28x192 |
28x28x128 |
1x1, 3x3 |
1, 1 |
0, 1 |
192 |
96 |
1x1卷积核降维至96个通道,再通过3x3卷积核扩展到128个通道 |
branch3 |
Conv2d + ReLU + Conv2d + ReLU |
28x28x192 |
28x28x32 |
1x1, 5x5 |
1, 1 |
0, 2 |
192 |
16 |
1x1卷积核降维至16个通道,再通过5x5卷积核扩展到32个通道 |
branch4 |
MaxPooling2d + Conv2d + ReLU |
28x28x192 |
28x28x32 |
3x3, 1x1 |
1, 1 |
1, 0 |
- |
- |
3x3最大池化后,通过1x1卷积核降维至32个通道 |
表格解释
- 层名称:表示该层在 GoogLeNet 中的具体位置或名称。
- 类型:指明该层是卷积层(Conv2d)、最大池化层(MaxPooling2d)还是 Inception 模块。
- 输入尺寸:表示该层接收的输入特征图的尺寸,格式为
高度x宽度x通道数
。
- 输出尺寸:表示该层产生的输出特征图的尺寸,格式为
高度x宽度x通道数
。
- 卷积核尺寸:对于卷积层,表示使用的卷积核的尺寸;对于 Inception 模块,表示该模块内不同分支使用的卷积核尺寸。