pytorch保存模型的坑

最新推荐文章于 2024-07-16 09:09:45 发布

chenf99

最新推荐文章于 2024-07-16 09:09:45 发布

阅读量5k

点赞数 6

CC 4.0 BY-SA版权

分类专栏：深度学习

本文链接：https://blog.youkuaiyun.com/chenf1999/article/details/104333709

本文介绍了PyTorch在保存和加载模型过程中遇到的设备错误和模型错误，包括如何处理模型默认在GPU上的问题，解决不同PyTorch版本之间的兼容性问题，以及如何正确保存和恢复优化器的状态。总结建议在保存时将模型和优化器参数转到CPU，并根据训练需求决定是否保存优化器状态。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

pytorch中保存模型相关的函数有3个：

torch.save：利用python的pickle模块实现序列化并保存序列化后的object
torch.load：利用pickle将保存的object反序列化
torch.nn.Module.load_state_dict：通过反序列化得到的state_dict读取保存的训练参数

有两种方法保存模型：

1. torch.save(model, path) # 直接保存整个模型
2. torch.save(model.state_dict(), path) # 保存模型的参数

相应地有两种方法加载保存的模型：

1. model = torch.load(path) # 直接加载模型
2. model = Model()                         # 先初始化一个模型
   model.load_state_dict(torch.load(path))

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

chenf99

关注关注

6
点赞
踩
29

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Pytorch加载保存好的模型发现与实际保存模型的参数不一致

weixin_42416791的博客

09-03

1万+

Pytorch加载保存好的模型发现与实际保存的参数不一致发现问题初衷：问题：保存模型并打印参数：加载模型并打印模型参数问题来了解决问题先说结论原因：联想问题本质二级目录三级目录参考博客发现问题初衷：最近跑深度学习代码，数据量比较庞大所以训练速度慢的一，一旦有什么问题训练突然停止了，心态都要炸了，所以这时候使用pytorch保存每轮训练好的模型（可以使用一些保存技巧，保存得到的当前最新的模型checkpoint，倒不至于每轮都保存），即使训练停止还能接着去加载保存好的模型得到当前模型输出结果，节省时间，

C#调用pytorch模型

恋try的专栏

08-05

1173

C#代码调用pytorch训练好的模型

4 条评论您还未登录，请先登录后发表或查看评论

TorchMetrics 自定义评估方法，object has no attribute ‘_defaults‘

northsky0307的博客

04-07

1158

对于如何自定义评估方法，也就是重写Metrics的子类。官方文档和TorchMetrics：PyTorch的指标度量库都写的比较完备了。针对第二篇文章中给出的样例，在实现后得到object has no attribute '_defaults’报错。原因在于没有初始化父类。加上super().__init__()就可以了 ...

MASK-R-CNN报错：AttributeError: ‘SGD‘ object has no attribute ‘get_updates‘

weixin_51865574的博客

11-24

506

在model.py中将tf.keras.optimizers.SGD。

解决TensorFlow中‘SGD‘ object has no attribute ‘apply_gradient’报错问题

qq_39492314的博客

11-12

4294

昨天使用TensorFlow训练是出现了’SGD’ object has no attribute ‘apply_gradient’的问题，注意不是apply_gradients，于是查了下解决办法，发现没有特别有用的，不是copy别人的就是说增加 from tensorflow_core.python.keras import datasets, layers，于是决定自己排除原因。首先查看keras的安装目录：进入keras的目录，然后发现有于是打开optimizers.py文件，发现没有a

“AttributeError： Object has no attribute”

终身学习，每天进步一点点

12-28

1万+

“AttributeError： Object has no attribute”

【PyTorch】成功解决AttributeError: ‘Tensor‘ object has no attribute ‘weight‘

创作高质量博文，分享知识，共同进步！

03-26

3513

🔥【PyTorch】深度解析AttributeError，让你告别'Tensor'对象无'weight'属性的困扰！🚀 😱初遇AttributeError，你是否感到困惑？'Tensor'对象为何无'weight'属性？ 💡别担心，我们为你揭秘！理解对象类型与属性，让你轻松掌握PyTorch。 📚深入了解PyTorch中的对象与属性，避免踩坑，提升开发效率。 🛠️实践中注意事项一网打尽，让你在开发中少走弯路。 🔄举一反三，从此告别类似错误，让你的PyTorch之路更加顺畅！

在pytorch中使用用npz文件保存的预训练模型

weixin_44020747的博客

03-25

1万+

TensorFlow与PyTorch：模型参数查看与可视化攻略

fengbeely的博客

07-16

1150

目前netron支持 ONNX (.onnx, .pb, .pbtxt), Keras (.h5, .keras), Core ML (.mlmodel), Caffe (.caffemodel, .prototxt), Caffe2 (predict_net.pb, predict_net.pbtxt), Darknet (.cfg), MXNet (.model, -symbol.json), ncnn (.param) and TensorFlow Lite (.tflite)。

python调用类内创建对象时，显示object has no attribute

qq_43667603的博客

04-12

3136

如果你不是因为双下划线忽略，那么还有一种可能就是python有个内置函数__int__()，也会显示成紫色，和__init__()长得也太像了把！明明已经定义了，为什么会没有呢？

问题解决：AttributeError: ResultSet object has no attribute ‘get‘.

SueMagic

07-02

7060

问题： list_links_docs = [] soup = get_link_decode(URL) for link in range(10): link = soup.find_all("a",text="{}".format(link)) list_links_docs.append(link) for link in list_links_docs: lis = link.get("href") print(lis) 执行这个程序出现

tensorflow报错：'GradientDescentOptimizer' object has no attribute 'minimizer'

荒野雄兵的专栏

02-28

8355

今天用Tensor跑手写数字识别的时候遇见这样一个错误： optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate).minimizer(loss) AttributeError: 'GradientDescentOptimizer' object has no attribute 'minimizer' ...

Python脚本报错AttributeError: ‘module’ object has no attribute’xxx’解决方法

八月的专栏

01-14

4万+

Python脚本报错AttributeError: ‘module’ object has no attribute’xxx’解决方法 2014年04月30日 ⁄ 测试工具, 软件测试 ⁄ 共 678字 ⁄ 字号小中大 ⁄ 暂无评论 ⁄ 阅读 12,782 次最近在编写Python脚本过程中遇到一个问题比较奇怪：Python脚本正常的，但执行报错"A

AttributeError: ‘Tensor‘ object has no attribute ‘zero‘

m0_52018502的博客

09-04

2162

zero_少打一个_ 相像报错报错，grad没有data这个属性，原因是，在系统将w的grad值初始化为none，第一次求梯度计算是在none值上进行报错，自然会没有data属性修改方法：添加一个判断语句，从第二次循环开始执行求导运算 ...

‘Adam‘ object has no attribute ‘get_updates‘

qq_42461481的博客

03-01

1746

复现代码时，碰到这个错误，发现是tensorflow版本错误，把tensorflow卸载干净，再重装就好了。或者检查一下，是不是别的库，比如numpy、Pandas、matplotlib版本不对。一般版本改回来就可以运行了。

pytorch报错AttributeError: ‘NoneType‘ object has no attribute ‘zero_‘

一个bug是bug，多个bug能work

11-14

8809

解决方案：原代码如下： with torch.no_grad(): w1 = w1 - learning_rate * w1.grad w2 = w2 - learning_rate * w2.grad # 反向传播后手动将梯度设置为零 w1.grad.zero_() w2.grad.zero_() 使用pytorch构建神经网络，在参数更新后，将梯度清0时报错：使用"-="运算符，将代码修改为： with torch.no_grad(

Python报错AttributeError: ‘module’ object has no attribute’xxx’解决方法

最新发布

03-28

<think>嗯，用户想了解如何保存和加载模型。我应该先回忆一下常见的机器学习框架，比如TensorFlow和PyTorch，它们有不同的方法。用户可能需要基础的解释，所以得一步步来，结构要清晰。首先，保存模型的目的通常是为了后续的部署或者继续训练，所以需要涵盖这两个方面。可能得分开讲解保存整个模型和仅保存参数，因为用途不同。比如，PyTorch里保存整个模型用torch.save(model, 'path.pth')，而保存状态字典是另一种方法。需要说明两者的区别，比如状态字典更灵活，占用空间小。然后，TensorFlow方面，Keras的API比较简单，model.save()可以直接保存整个模型，包括结构和参数。另外，保存为HDF5格式可能也要提一下。加载的时候，用load_model就可以了。用户可能还会关心SavedModel格式，这是TensorFlow Serving用的，需要稍微解释一下。还要注意代码示例的正确性，确保语法正确。比如PyTorch的状态字典保存和加载步骤，以及TensorFlow的保存方法。可能用户会混淆不同框架的步骤，所以需要分开说明，避免混淆。另外，需要提到跨框架的情况，比如ONNX，但可能用户暂时不需要，所以简单带过即可。最后，注意事项也很重要，比如自定义层的处理，版本兼容性问题，这些是实际使用中容易遇到的坑，必须提醒用户。结构方面，先介绍保存模型的意义，再分框架讲解步骤，最后注意事项。这样用户能逐步理解。要确保使用中文，术语正确，比如“状态字典”这样的术语可能需要保持英文加中文解释。比如，state_dict可以翻译为状态字典，但保留英文原词可能更准确，然后在括号里加中文解释。可能还需要比较不同保存方式的优缺点，比如保存整个模型方便但不够灵活，保存参数需要重新定义模型结构。用户可能在实际应用中选择不同的方式，所以需要解释清楚适用场景。检查是否有遗漏的点，比如分布式训练的情况？可能对于初学者来说暂时不需要，所以可以忽略。最后确保LaTeX格式正确，用户提到的行内公式用$...$，独立公式用$$...$$，但在回答中可能数学公式不多，不过如果有的话需要注意格式。总结下来，回答的结构应该是： 1. 保存模型的意义 2. PyTorch的方法 a. 保存整个模型 b. 保存状态字典 c. 加载方法 3. TensorFlow/Keras的方法 a. 保存整个模型 b. 保存为HDF5 c. 加载方法 4. 注意事项然后每个部分给出代码示例，并说明适用情况。最后注意事项提醒版本、自定义层、生产部署等。</think>### 如何保存和加载模型（以 PyTorch 和 TensorFlow 为例） --- #### **一、保存模型的意义** 保存模型可将训练好的参数、网络结构持久化存储，便于： 1. 后续直接推理（无需重新训练） 2. 断点续训（防止训练中断） 3. 跨平台部署（如移动端、服务器） --- #### **二、PyTorch 模型保存与加载** ##### **1. 保存整个模型（结构 + 参数）** ```python import torch # 保存模型 torch.save(model, 'model.pth') # 加载模型 loaded_model = torch.load('model.pth') ``` - **优点**：简单直接，适合快速部署 - **缺点**：文件较大，可能与代码版本强耦合 ##### **2. 仅保存参数（推荐方式）** ```python # 保存模型参数（state_dict） torch.save(model.state_dict(), 'model_weights.pth') # 加载参数（需先定义相同结构的模型） model = MyModel() # 必须与保存时的结构一致 model.load_state_dict(torch.load('model_weights.pth')) ``` - **优点**：文件小，灵活性强 - **适用场景**：需修改部分结构的场景（如迁移学习） --- #### **三、TensorFlow/Keras 模型保存与加载** ##### **1. 保存整个模型（SavedModel 格式）** ```python # 保存模型（默认 SavedModel 格式） model.save('my_model') # 加载模型 loaded_model = tf.keras.models.load_model('my_model') ``` ##### **2. 保存为 HDF5 文件** ```python # 保存模型（包含结构和参数） model.save('my_model.h5') # 加载模型 loaded_model = tf.keras.models.load_model('my_model.h5') ``` ##### **3. 仅保存参数** ```python # 保存权重 model.save_weights('model_weights.h5') # 加载权重（需先构建相同结构） model = MyModel() model.load_weights('model_weights.h5') ``` --- #### **四、注意事项** 1. **版本兼容性** - PyTorch/TensorFlow 版本需一致，否则加载可能失败。 2. **自定义层处理** - 自定义层需在加载前定义同名类（PyTorch）或通过 `custom_objects` 传入（TensorFlow）。 3. **生产部署优化** - PyTorch 可转 TorchScript（`torch.jit.save`），TensorFlow 可用 `tf.saved_model` 导出。 --- #### **五、总结** | 框架 | 保存方式 | 适用场景 | |----------|-------------------|--------------------------| | PyTorch | `state_dict` | 灵活加载、迁移学习 | | TensorFlow| SavedModel/HDF5 | 直接部署、跨平台兼容 | 按需选择保存方式，优先使用参数保存（轻量且灵活）！