pytorch学习笔记之加载预训练模型

AI算法札记

已于 2022-07-23 14:44:58 修改

阅读量8.2w

点赞数 127

CC 4.0 BY-SA版权

分类专栏：深度学习框架文章标签： pytorch

于 2018-06-21 14:38:32 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_41278720/article/details/80759933

深度学习框架专栏收录该内容

12 篇文章

订阅专栏

本文介绍了PyTorch中torchvision.models包的使用方法，详细讲述了四种模型加载方式：直接加载预训练模型、修改某一层、加载部分预训练模型及加载自定义模型，并附上了示例代码。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

同名微信公众号/知乎专栏: AI算法札记，欢迎关注交流

pytorch自发布以来，由于其便捷性，赢得了越来越多人的喜爱。

Pytorch有很多方便易用的包，今天要谈的是torchvision包，它包括3个子包，分别是： torchvison.datasets ，torchvision.models ，torchvision.transforms ，分别是预定义好的数据集（比如MNIST、CIFAR10等）、预定义好的经典网络结构（比如AlexNet、VGG、ResNet等）和预定义好的数据增强方法（比如Resize、ToTensor等）。这些方法可以直接调用，简化我们建模的过程，也可以作为我们学习或构建新的模型的参考。

本文，我们讲述的是models，且只谈模型的加载。models这个包中包含alexnet、densenet、inception、resnet、squeezenet、vgg等常用的网络结构，并且提供了预训练模型，可以通过简单调用来读取网络结构和预训练模型。

模型地址：https://github.com/pytorch/vision/tree/master/torchvision/models

官方文档：https://pytorch.org/docs/master/torchvision/models.html

我将加载的方法简单总结为以下四种：

1.直接加载预训练模型

import torchvision.models as models

resnet50 = models.resnet50(pretrained=True)

这样就导入了resnet50的预训练模型了。

如果只需要网络结构，不需要用预训练模型的参数来初始化，那么就是：

model =torchvision.models.resnet50(pretrained=False)

或者把resnet复制到自己的目录下，新建个model文件夹

可以参考下面的猫狗大战入门算法入门

https://github.com/JackwithWilshere/Kaggle-Dogs_vs_Cats_PyTorch

2.修改某一层

以resnet为例，默认的是ImageNet的1000类，比如我们要做二分类，分类猫和狗

resnet.fc = nn.Linear(2048, 2)

resnet 第一层卷积的卷积核是7，我们可能想改成5，那么可以通过以下方法修改：

#未经试验，修改需要有理论依据，计算featuremap维度使之匹配。
resnet.conv1 = nn.Conv2d(3, 64,kernel_size=5, stride=2, padding=3, bias=False)

3.加载部分预训练模型

对于具体的任务，很难保证模型和公开的模型完全一样，但是预训练模型的参数确实有助于提高训练的准确率，为了结合二者的优点，就需要我们加载部分预训练模型。

#加载model，model是自己定义好的模型
resnet50 = models.resnet50(pretrained=True) 
model =Net(...) 

#读取参数 
pretrained_dict =resnet50.state_dict() 
model_dict = model.state_dict() 

#将pretrained_dict里不属于model_dict的键剔除掉 
pretrained_dict =  {k: v for k, v in pretrained_dict.items() if k in model_dict} 

# 更新现有的model_dict 
model_dict.update(pretrained_dict) 

# 加载我们真正需要的state_dict 
model.load_state_dict(model_dict)

4. 加载自己的模型

其实这个是保存和恢复模型，比如我们训练好的模型保存，然后加载用于测试。

方法一(推荐)：

第一种方法也是官方推荐的方法，只保存和恢复模型中的参数。

使用这种方法，我们需要自己导入模型的结构信息。

（1）保存

torch.save(model.state_dict(), PATH)

#example
torch.save(resnet50.state_dict(),'ckp/model.pth')

（2）恢复

model = ModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))

#example
resnet=resnet50(pretrained=True)
resnet.load_state_dict(torch.load('ckp/model.pth'))

方法二：

使用这种方法，将会保存模型的参数和结构信息。

(1)保存