2018.11.21

本文详细解析了PyTorch中模型参数的管理和存储方法,包括使用model.state_dict()保存模型参数、利用torch.save()和torch.load()进行模型的持久化存储与加载,以及如何将模型转移到GPU上运行,提供了AlexNet网络结构作为实例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

model.parameters

model.state_dict输出的是一样的结果

model.state_dict()存的是网络的参数,输出是这样的形式。

所以在存训练的网络的时候,save方法中传的是state_dict()形式的才能存储网络的参数,其次在nn.Module的文件中只是实现了load的方法,load_state_dict()方法,并没有save()方法,save()方法是在torch文件下实现的。torch.save(obj,filename),对应的load(filename)。

sorted()对文件按照index进行排序

split()方法熟练掌握

torch.cuda.is_available()

import torch as t
device = t.device("cuda:0" if t.cuda.is_available() else "cpu")
net.to(device)
tensor1.to(device)

pass model.parameters() to optimizer

t.optimizer.Adam(self.parameters(),lr=lr,weight_decay=weight_decay)

x=t.randn(5,4,2)
x.shape   
#(5,4,2)
a=x.view(x.size(0),,1)
a.shape 
# (5,8)

AlexNet的网络结构

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值