model_state_dict网络部分参数的更新(非严格模式加载model)

原创已于 2022-11-19 21:55:04 修改 · 942 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

于 2022-08-05 17:00:03 首次发布

深度学习专栏收录该内容

180 篇文章

订阅专栏

本文探讨了字典的update方法在模型参数加载中的应用，以及在模型保存与加载时，面对不一致和关键字段缺失情况下的处理技巧。重点讲解了如何正确使用strict参数和部分模型键的合并操作。

基础：字典的update方法

marks = {'Physics':67, 'Maths':87}
internal_marks = {'Practical':48}
marks.update(internal_marks)

print(marks)
# Output: {'Physics': 67, 'Maths': 87, 'Practical': 48}

不一致时

model.load_state_dict(model_state_dict, strict=False)

保存模型的key多

model_state_dict, optimizer_state_dict = loader(os.path.join(checkpoint_floder, config["model_loadname"]))

model_dict = model.state_dict()
model_state_dict = {k: v for k, v in model_state_dict.items() if k in model_dict}
model_dict.update(model_state_dict)

model.load_state_dict(model_dict)

保存模型的key少

# 先获取保存的key
model_state_dict, optimizer_state_dict = loader(os.path.join(checkpoint_floder, config["model_loadname"]))

# 获取当前模型的key
model_dict = model.state_dict()
model_dict.update(model_state_dict)# 用保存的key部分更新当前模型的key，得到model_dict

model.load_state_dict(model_dict)# 将更新的model_dict加载给当前的模型

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

FakeOccupational

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Pytorch实战教程】Pytorch中model.load_state_dict()的详细介绍

若北辰

07-25

3232

该方法用于将预先保存的参数字典加载到模型中。这种方法非常灵活，适用于加载不同环境中的模型参数。是 PyTorch 中加载模型参数的标准方法。通过理解state_dict和strict参数的用法，可以灵活地在不同模型版本之间加载和迁移参数，提高模型的复用性和管理效率。

load_state_dict参数及函数使用

3 条评论

FakeOccupational 2022.11.19
现在改一下

FakeOccupational 2022.11.19
[face]emoji:010.png[/face]对，你的是对的

多看一眼就爆炸靠近点就被融化 2022.11.19
保存模型的key多: line7:model.load_state_dict(model_state_dict) I think it was wrong, shouldn't it be model.load_state_dict(model_dict)