2018.11.21

dashan8608

于 2018-11-22 20:08:01 发布

阅读量110

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/dashan8608/article/details/84346037

本文详细解析了PyTorch中模型参数的管理和存储方法，包括使用model.state_dict()保存模型参数、利用torch.save()和torch.load()进行模型的持久化存储与加载，以及如何将模型转移到GPU上运行，提供了AlexNet网络结构作为实例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

model.parameters

model.state_dict输出的是一样的结果

model.state_dict()存的是网络的参数，输出是这样的形式。

所以在存训练的网络的时候，save方法中传的是state_dict（）形式的才能存储网络的参数，其次在nn.Module的文件中只是实现了load的方法，load_state_dict()方法，并没有save（）方法，save（）方法是在torch文件下实现的。torch.save(obj,filename),对应的load（filename）。

sorted（）对文件按照index进行排序

split（）方法熟练掌握

torch.cuda.is_available()

import torch as t
device = t.device("cuda:0" if t.cuda.is_available() else "cpu")
net.to(device)
tensor1.to(device)

pass model.parameters() to optimizer

t.optimizer.Adam(self.parameters(),lr=lr,weight_decay=weight_decay)

x=t.randn(5,4,2)
x.shape   
#(5,4,2)
a=x.view(x.size（0），,1)
a.shape 
# (5,8)

AlexNet的网络结构