pytorch多卡训练模型

求求给个学位吧

已于 2025-04-03 23:27:27 修改

阅读量308

点赞数 6

CC 4.0 BY-SA版权

文章标签： pytorch 人工智能 python

于 2025-03-30 19:00:24 首次发布

本文链接：https://blog.youkuaiyun.com/wanggeniubi/article/details/146770662

DP方法

基本原理

也即是：数据拆分，模型不拆分的思路。

输入数据自动分割成若干小批量，并将模型复制到指定的多个 GPU 上。所有 GPU 计算得到的梯度会在主设备（device_ids 列表中的第一个 GPU）进行汇总后更新模型参数。这时的batch size应该是单块显卡上的batch size乘以显卡数量。

适用场景

适用于模型较小的场景。但会造成主设备负载过高。

使用方法

#------------------------- 初始化device变量------------------------- 
device = torch.device('cuda:1' if torch.cuda.is_available() else "cpu")

#-------------- 修改batch size为所有显卡训练的batch size总和 --------------
train_dataloader = DataLoader(train_dataset, 8, True)

# ------------------------- 模型初始化、数据并行 -------------------------
model = model(num_class=3)

#调用DataParallel类，传参数。第二个参数为一个list，为参与并行计算的显卡的id，从0开始
#要注意list的第一个数字要和初始化device的显卡号对应一致，否则会报错。
model = model.to(device)  # 先移到主GPU
model = torch.nn.DataParallel(module=model, device_ids=[1, 0, 2, 3])  # 然后包装

主要是上面三个部分要做改动。整体比较简单。