pytorch学习（4）数据并行_pytorch如何并行 to()-优快云博客

本文链接：https://blog.youkuaiyun.com/lzr_ps/article/details/103843207

本文介绍了如何在PyTorch中利用DataParallel进行模型的数据并行训练，讲解了将模型和张量迁移到GPU以及DataParallel的工作原理。虽然作者目前只有一个GPU，但阐述了在拥有多个GPU的情况下，数据如何被分割并在不同GPU上并行处理，最后展示了简单的代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

pytorch学习（4）数据并行

pytorch60分钟教程最后一篇，这次学习如何使用DataParallel来调用多个GPU(然而实验室的GPU我还没用过)
在前面的学习中我们知道用如下方法来使用GPU：
把模型放入GPU中：

device = torch.device("cuda:0")
model.to(device)

把张量放入GPU中：

mytensor = my_tensor.to(device)

而通过 model = nn.DataParallel(model) 我们可以让数据集被分割送入不同的GPU，运行完成后再收集回来。

举个栗子：
先创建一个假数据集：

import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader

# Parameters and DataLoaders
input_size = 5
output_size = 2

batch_size = 30
data_size = 100

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

class RandomDataset(Dataset):

    def __init__(self, size, length):
        self.len = length
        self.data = torch.randn(length, size)

    def __getitem__(self, index):
        return self.data[index]

    def __len__(self):
        return self.len

rand_loader = DataLoader(dataset=RandomDataset(input_size, data_size),
                         batch_size=batch_size, shuffle=True)

创建一个简单模型：

class Model(nn.Module):
    # Our model

    def __init__(self, input_size, output_size):
        super(Model, self).__init__()
        self.fc = nn.Linear(input_size, output_size)

    def forward(self, input):
        output = self.fc(input)
        print("\tIn Model: input size", input.size(),
              "output size", output.size())

        return output

使用 nn.DataParallel 包装模型：

model = Model(input_size, output_size)
if torch.cuda.device_count() > 1:
  print("Let's use", torch.cuda.device_count(), "GPUs!")
  # dim = 0 [30, xxx] -> [10, ...], [10, ...], [10, ...] on 3 GPUs
  model = nn.DataParallel(model)

model.to(device)

运行：

for data in rand_loader:
    input = data.to(device)
    output = model(input)
    print("Outside: input size", input.size(),
          "output_size", output.size())

output：
然鹅我只有一块GPU。。。

In Model: input size torch.Size([30, 5]) output size torch.Size([30, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
	In Model: input size torch.Size([30, 5]) output size torch.Size([30, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
	In Model: input size torch.Size([30, 5]) output size torch.Size([30, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
	In Model: input size torch.Size([10, 5]) output size torch.Size([10, 2])
Outside: input size torch.Size([10, 5]) output_size torch.Size([10, 2])

两块GPU情况下应该是这样的：

Let's use 2 GPUs!
    In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
    In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
    In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
    In Model: input size torch.Size([15, 5]) output size torch.Size([15, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
    In Model: input size torch.Size([5, 5]) output size torch.Size([5, 2])
    In Model: input size torch.Size([5, 5]) output size torch.Size([5, 2])
Outside: input size torch.Size([10, 5]) output_size torch.Size([10, 2])

-------------------------------------------------------------------分割线-------------------------------------------------------------------------------
60分钟教程学习完毕，但是这个专栏我还会更新下去，主要是针对以后实验中遇到的问题，拜拜