PyTorch模型组合——深入探讨nn.ModuleList和nn.Sequential-优快云博客

本文链接：https://blog.youkuaiyun.com/AI_dataloads/article/details/134296832

本文比较了PyTorch中nn.ModuleList和nn.Sequential两种模块容器，解释了它们的动态构建、自动跟踪特点以及在不同场景下的适用性。nn.ModuleList适用于动态结构，nn.Sequential适合线性堆叠模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、前言

当我们使用PyTorch构建深度学习模型时，可能会经常遇到nn.ModuleList和nn.Sequential这两个模块。它们都是PyTorch中用于构建神经网络模型的容器，但它们在设计和用法上有一些关键区别。

`二、nn.ModuleList`

nn.ModuleList是PyTorch中的一个容器，它允许你将多个模块组合在一起，形成一个更大的模块。它的主要特点如下：

动态构建模块列表：你可以在创建nn.ModuleList后，随时动态添加模块到列表中。这对于那些需要在运行时根据条件构建不同子模块的情况非常有用。
不会自动跟踪模块：nn.ModuleList不会自动跟踪其包含的模块，这意味着它的参数不会自动添加到父模块的参数列表中。你需要自己手动管理这些参数。

下面是一个使用nn.ModuleList的简单示例，其中我们创建了一个具有可变数量的全连接层的神经网络：

import torch.nn as nn

# 定义一个自定义神经网络模型 CustomModel，它继承自 nn.Module 类
class CustomModel(nn.Module):
    def __init__(self, layer_sizes):
        # 在构造函数中初始化模型
        super(CustomModel, self).__init__()
        
        # 创建一个神经网络层列表，每个元素都是一个线性层 (nn.Linear)
        # layer_sizes 是一个包含每个层的输入和输出维度的列表
        # 循环遍历 layer_sizes，创建并添加线性层到 layers
        self.layers = nn.ModuleList([nn.Linear(layer_sizes[i], layer_sizes[i + 1]) for i in range(len(layer_sizes) - 1)])

    def forward(self, x):
        # 定义前向传播函数 forward
        # 输入 x 表示模型的输入数据
        
        # 遍历 self.layers 中的线性层，依次将输入 x 传递给每一层
        for layer in self.layers:
            x = layer(x)
        
        # 返回最终输出，x 包含了前向传播后的模型输出
        return x

在上述示例中，nn.ModuleList用于存储一系列全连接层，这些层的数量由layer_sizes参数动态确定。这是nn.ModuleList的一个典型应用，因为我们需要在运行时构建不同数量的层。

`三、nn.Sequential`

nn.Sequential是另一个PyTorch容器，但它与nn.ModuleList有一些重要的不同之处：

顺序模块容器：nn.Sequential是一个按顺序排列的模块容器，它将其包含的模块依次连接在一起，从输入到输出。这意味着模块按照指定的顺序进行前向传播。
自动参数跟踪：与nn.ModuleList不同，nn.Sequential会自动跟踪其包含的模块，并将它们的参数自动添加到父模块的参数列表中。这使得参数管理更加方便。

下面是一个使用nn.Sequential的示例，其中我们构建一个简单的卷积神经网络：

import torch.nn as nn

# 定义一个卷积神经网络模型 ConvNet，它继承自 nn.Module 类
class ConvNet(nn.Module):
    def __init__(self):
        # 在构造函数中初始化模型
        super(ConvNet, self).__init__()

        # 定义模型的特征提取层 features
        self.features = nn.Sequential(
            # 第一个卷积层：输入通道数为1，输出通道数为32，卷积核大小为3，边界填充为1
            nn.Conv2d(1, 32, kernel_size=3, padding=1),
            nn.ReLU(),
            # 最大池化层，池化核大小为2，步幅为2
            nn.MaxPool2d(kernel_size=2, stride=2),
            # 第二个卷积层：输入通道数为32，输出通道数为64，卷积核大小为3，边界填充为1
            nn.Conv2d(32, 64, kernel_size=3, padding=1),
            nn.ReLU(),
            # 最大池化层，池化核大小为2，步幅为2
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        # 定义模型的分类层 classifier
        self.classifier = nn.Sequential(
            # 全连接层，将输入展平为一维向量，输入大小为 64 * 7 * 7，输出大小为128
            nn.Linear(64 * 7 * 7, 128),
            nn.ReLU(),
            # 全连接层，输入大小为128，输出大小为10，对应于10个类别的预测
            nn.Linear(128, 10)
        )

    def forward(self, x):
        # 定义前向传播函数 forward，输入 x 表示模型的输入数据

        # 将输入 x 通过特征提取层 features 进行特征提取
        x = self.features(x)
        
        # 将特征张量展平为一维向量，以便输入全连接层
        x = x.view(x.size(0), -1)
        
        # 将展平后的特征向量通过分类层 classifier 进行分类预测
        x = self.classifier(x)
        
        # 返回最终的分类预测结果
        return x

在上述示例中，nn.Sequential用于按照顺序构建卷积层和全连接层。这种线性的顺序非常适合那些每一层都依赖于前一层输出的情况。

四、如何选择使用哪个容器？

选择使用nn.ModuleList还是nn.Sequential取决于你的模型的结构和需求：

如果你的模型需要在运行时根据条件构建不同的子模块，或者你需要更大的灵活性来管理模块的顺序，那么nn.ModuleList可能更适合。
如果你的模型是一个线性堆叠的模块序列，每一层的输出都作为下一层的输入，那么nn.Sequential可能更适合，因为它提供了更简单的构建方式和参数管理。

总结起来：

nn.ModuleList 适用于需要在运行时根据条件动态构建不同子模块的情况，而 nn.Sequential 适用于构建线性堆叠的模块序列，适合简化模型的构建和参数管理。通常，你可以在一个模型中同时使用这两种容器，根据需求组合它们以构建更复杂的模型。