【VGG11】VGG11 网络结构

该代码实现了一个简化版的VGG11模型,包含多个卷积层(Conv2d)和最大池化层(MaxPool2d),使用ReLU激活函数,并在卷积层后接全连接层进行分类。模型总参数量约为2,074,776个。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

class VGG11(nn.Module):
    def __init__(self):
        super(VGG11, self).__init__()

        self.conv_block1 = nn.Sequential(
            nn.Conv2d(in_channels=1, out_channels=8, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.conv_block2 = nn.Sequential(
            nn.Conv2d(in_channels=8, out_channels=16, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.conv_block3 = nn.Sequential(
            nn.Conv2d(in_channels=16, out_channels=32, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.Conv2d(in_channels=32, out_channels=32, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.conv_block4 = nn.Sequential(
            nn.Conv2d(in_channels=32, out_channels=64, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.Conv2d(in_channels=64, out_channels=64, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.conv_block5 = nn.Sequential(
            nn.Conv2d(in_channels=64, out_channels=64, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.Conv2d(in_channels=64, out_channels=64, kernel_size=3, stride=1, padding=1),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.linear1 = nn.Sequential(
            nn.Linear(in_features=3136, out_features=512),
            nn.ReLU(),
            nn.Dropout(p=0.5)
        )

        self.linear2 = nn.Sequential(
            nn.Linear(in_features=512, out_features=512),
            nn.ReLU(),
            nn.Dropout(p=0.5)
        )

        self.linear3 = nn.Linear(in_features=512, out_features=120)


    def forward(self, x):
        x = self.conv_block1(x)
        x = self.conv_block2(x)
        x = self.conv_block3(x)
        x = self.conv_block4(x)
        x = self.conv_block5(x)
        x = x.view(x.shape[0], -1)
        x = self.linear1(x)
        x = self.linear2(x)
        x = self.linear3(x)
        return x


net = VGG11()
summary(net, input_size=(1, 224, 224))

输出:

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
================================================================
            Conv2d-1          [-1, 8, 224, 224]              80
              ReLU-2          [-1, 8, 224, 224]               0
         MaxPool2d-3          [-1, 8, 112, 112]               0
            Conv2d-4         [-1, 16, 112, 112]           1,168
              ReLU-5         [-1, 16, 112, 112]               0
         MaxPool2d-6           [-1, 16, 56, 56]               0
            Conv2d-7           [-1, 32, 56, 56]           4,640
              ReLU-8           [-1, 32, 56, 56]               0
            Conv2d-9           [-1, 32, 56, 56]           9,248
             ReLU-10           [-1, 32, 56, 56]               0
        MaxPool2d-11           [-1, 32, 28, 28]               0
           Conv2d-12           [-1, 64, 28, 28]          18,496
             ReLU-13           [-1, 64, 28, 28]               0
           Conv2d-14           [-1, 64, 28, 28]          36,928
             ReLU-15           [-1, 64, 28, 28]               0
        MaxPool2d-16           [-1, 64, 14, 14]               0
           Conv2d-17           [-1, 64, 14, 14]          36,928
             ReLU-18           [-1, 64, 14, 14]               0
           Conv2d-19           [-1, 64, 14, 14]          36,928
             ReLU-20           [-1, 64, 14, 14]               0
        MaxPool2d-21             [-1, 64, 7, 7]               0
           Linear-22                  [-1, 512]       1,606,144
             ReLU-23                  [-1, 512]               0
          Dropout-24                  [-1, 512]               0
           Linear-25                  [-1, 512]         262,656
             ReLU-26                  [-1, 512]               0
          Dropout-27                  [-1, 512]               0
           Linear-28                  [-1, 120]          61,560
================================================================
Total params: 2,074,776
Trainable params: 2,074,776
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.19
Forward/backward pass size (MB): 15.65
Params size (MB): 7.91
Estimated Total Size (MB): 23.75
### 关于 VGG11 网络结构VGG11 是一种经典的卷积神经网络架构,属于 VGG 家族的一部分。它由牛津大学视觉几何组(Visual Geometry Group, VGG)设计,并在 ImageNet 挑战赛中取得了显著的成绩[^1]。该网络的特点在于使用了多个小型的 3×3 卷积核堆叠来构建深层网络,从而提高了模型的表现力。 #### VGG11 的基本结构描述 VGG11 结构包含 8 个卷积层和 3 个全连接层。它的每一层都遵循相同的模式:通过一系列的小型卷积操作提取特征,随后利用最大池化降低空间维度。这种简单的重复单元使得网络易于扩展和理解[^2]。 以下是 VGG11 的典型结构表: | 层次 | 类型 | 输出尺寸 | |------|--------------|----------------| | conv1_1 | Conv (64) | 224 × 224 | | pool1 | Max Pooling | 112 × 112 | | ... | | | 为了更直观地展示 VGG11 的层次关系,通常会绘制其 **网络结构图**。这些图表展示了每层之间的输入输出以及参数流动情况。 --- #### 如何获取 VGG11 网络结构图? 可以通过以下几种方式找到或生成 VGG11网络结构图: 1. 访问学术论文资源网站(如 Arxiv),下载原始文献《Very Deep Convolutional Networks for Large-Scale Image Recognition》,其中可能附带官方的网络结构图。 2. 使用可视化工具(如 Netron 或 TensorBoard)加载预定义的 VGG11 模型文件,自动生成图形表示。 3. 在搜索引擎中直接查询关键词 “VGG11 architecture diagram”,可以找到许多现成的图片资料。 如果需要编程实现,则可借助 PyTorch 或 TensorFlow 提供的标准 API 来打印或绘制成图。例如,在 PyTorch 中创建 VGG11 并导出其结构如下所示: ```python import torch from torchvision import models from torchsummary import summary # 加载预训练的 VGG11 模型 vgg11 = models.vgg11(pretrained=True) # 打印模型概要 summary(vgg11, input_size=(3, 224, 224)) ``` 此代码片段可以帮助开发者快速验证模型各部分的具体配置[^1]。 --- ### 总结 VGG11网络结构图不仅有助于研究者更好地理解其实现细节,还便于教学和技术交流场合下的演示用途。无论是查阅公开文档还是动手实践建模过程,都能加深对其工作原理的认识。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Enzo 想砸电脑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值