pytorch 模型的保存和加载

最新推荐文章于 2025-05-19 21:11:21 发布

摇摆的果冻

最新推荐文章于 2025-05-19 21:11:21 发布

阅读量3k

点赞数 1

分类专栏： Pytorch NN

Pytorch 同时被 2 个专栏收录

12 篇文章

订阅专栏

5 篇文章

订阅专栏

本文介绍在PyTorch中保存与恢复模型的方法。包括官方推荐的仅保存模型参数方式，以及同时保存模型结构与参数的方式。并提供了一个完整的示例，展示了如何保存和加载模型检查点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文转至：https://byjiang.com/2017/06/05/How_To_Save_And_Restore_Model/

在模型完成训练后，我们需要将训练好的模型保存为一个文件供测试使用，或者因为一些原因我们需要继续之前的状态训练之前保存的模型，那么如何在PyTorch中保存和恢复模型呢？

方法一(推荐)：

第一种方法也是官方推荐的方法，只保存和恢复模型中的参数。

保存

torch.save(the_model.state_dict(), PATH)

恢复

the_model = TheModelClass(*args, **kwargs)
the_model.load_state_dict(torch.load(PATH))

使用这种方法，我们需要自己导入模型的结构信息。

方法二：

使用这种方法，将会保存模型的参数和结构信息。

保存

torch.save(the_model, PATH)

恢复

the_model = torch.load(PATH)

一个相对完整的例子

saving

torch.save({
            'epoch': epoch + 1,
            'arch': args.arch,
            'state_dict': model.state_dict(),
            'best_prec1': best_prec1,
        }, 'checkpoint.tar' )

if args.resume:
        if os.path.isfile(args.resume):
            print("=> loading checkpoint '{}'".format(args.resume))
            checkpoint = torch.load(args.resume)
            args.start_epoch = checkpoint['epoch']
            best_prec1 = checkpoint['best_prec1']
            model.load_state_dict(checkpoint['state_dict'])
            print("=> loaded checkpoint '{}' (epoch {})"
                  .format(args.evaluate, checkpoint['epoch']))

获取模型中某些层的参数

对于恢复的模型，如果我们想查看某些层的参数，可以：

# 定义一个网络
from collections import OrderedDict
model = nn.Sequential(OrderedDict([
                  ('conv1', nn.Conv2d(1,20,5)),
                  ('relu1', nn.ReLU()),
                  ('conv2', nn.Conv2d(20,64,5)),
                  ('relu2', nn.ReLU())
                ]))
# 打印网络的结构
print(model)

OUT：

Sequential (
  (conv1): Conv2d(1, 20, kernel_size=(5, 5), stride=(1, 1))
  (relu1): ReLU ()
  (conv2): Conv2d(20, 64, kernel_size=(5, 5), stride=(1, 1))
  (relu2): ReLU ()
)

如果我们想获取conv1的weight和bias：

params=model.state_dict() 
for k,v in params.items():
    print(k)    #打印网络中的变量名

print(params['conv1.weight'])   #打印conv1的weight
print(params['conv1.bias'])   #打印conv1的bias