pytorch学习-莫烦

部署运行你感兴趣的模型镜像

https://www.bilibili.com/video/av15997678/?p=14

https://morvanzhou.github.io/tutorials/machine-learning/torch/3-04-save-reload/

要点 

训练好了一个模型, 我们当然想要保存它, 留到下次要用的时候直接提取直接用, 这就是这节的内容啦. 我们用回归的神经网络举例实现保存提取.

保存 

我们快速地建造数据, 搭建网络:

torch.manual_seed(1)    # reproducible

# 假数据
x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1)  # x data (tensor), shape=(100, 1)
y = x.pow(2) + 0.2*torch.rand(x.size())  # noisy y data (tensor), shape=(100, 1)

def save():
    # 建网络
    net1 = torch.nn.Sequential(
        torch.nn.Linear(1, 10),
        torch.nn.ReLU(),
        torch.nn.Linear(10, 1)
    )
    optimizer = torch.optim.SGD(net1.parameters(), lr=0.5)
    loss_func = torch.nn.MSELoss()

    # 训练
    for t in range(100):
        prediction = net1(x)
        loss = loss_func(prediction, y)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

接下来我们有两种途径来保存

torch.save(net1, 'net.pkl')  # 保存整个网络
torch.save(net1.state_dict(), 'net_params.pkl')   # 只保存网络中的参数 (速度快, 占内存少)

提取网络 

这种方式将会提取整个神经网络, 网络大的时候可能会比较慢.

def restore_net():
    # restore entire net1 to net2
    net2 = torch.load('net.pkl')
    prediction = net2(x)

只提取网络参数 

这种方式将会提取所有的参数, 然后再放到你的新建网络中.

def restore_params():
    # 新建 net3
    net3 = torch.nn.Sequential(
        torch.nn.Linear(1, 10),
        torch.nn.ReLU(),
        torch.nn.Linear(10, 1)
    )

    # 将保存的参数复制到 net3
    net3.load_state_dict(torch.load('net_params.pkl'))
    prediction = net3(x)

显示结果 

调用上面建立的几个功能, 然后出图.

# 保存 net1 (1. 整个网络, 2. 只有参数)
save()

# 提取整个网络
restore_net()

# 提取网络参数, 复制到新网络
restore_params()

保存提取

这样我们就能看出三个网络完全一模一样啦.

所以这也就是在我 github 代码 中的每一步的意义啦.

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

### 关于 `null` 的本质及其在 JavaScript 中的表现 在 JavaScript 中,`null` 是一种特殊的值,它表示一个空的或不存在的对象引用。然而,由于历史原因和技术实现细节,`typeof null` 返回的是 `"object"`[^1]。这种行为源于早期 JavaScript 引擎的设计决策,在底层实现中,`null` 的二进制形式全为 0,这使得其被错误分类为对象类型。 从更广泛的计算机科学角度来看,`null` 并不仅仅是一个简单的零值。实际上,它是用来标记未初始化或者无意义状态的一种特殊标志。特别是在 C 和其他低级编程语言中,`null` 常常作为指针的一个特例存在,它的本质可以被认为是指向地址 `0x00000000` 的指针[^2]。 尽管如此,这些概念并不直接影响 PyTorch 或者强化学习学习路径。以下是针对您提到的需求——强化学习中的 PyTorch 教程的相关信息: --- ### 强化学习PyTorch 结合的内容概述 #### 什么是 Python? Python 提供了一系列高质量的教学视频和文档,涵盖了从基础到高级的各种主题,其中包括机器学习、深度学习以及强化学习等内容。对于初学者来说,这是一个非常友好的起点。 #### 如何找到与 PyTorch 相关的强化学习资料? 如果您希望专注于基于 PyTorch 实现的强化学习算法,则可以从以下几个方面入手: 1. **官方文档** 官方网站提供了详细的 API 文档和教程,其中包含了如何利用 PyTorch 构建神经网络模型并将其应用于强化学习场景的例子。 2. **第三方课程推荐** - Bilibili 上有许多由个人开发者上传的免费教学视频,您可以搜索关键词“ PyTorch”或“PyTorch 强化学习”,通常能找到一些实用的讲解内容。 - GitHub 存储库也是获取开源项目的好地方。通过查询类似于 “pytorch reinforcement learning tutorial” 这样的关键字,能够发现许多社区贡献者的实践案例。 3. **书籍建议** 如果倾向于阅读纸质材料,《Deep Reinforcement Learning Hands-On》是一本不错的入门书目,书中部分章节专门讨论了怎样借助 PyTorch 来完成具体的实验设计。 下面给出一段简单演示代码片段用于展示如何定义策略梯度方法的基础框架 (Policy Gradient): ```python import torch import torch.nn as nn import torch.optim as optim class PolicyNetwork(nn.Module): def __init__(self, input_size, output_size): super(PolicyNetwork, self).__init__() self.fc = nn.Linear(input_size, output_size) def forward(self, state): action_probs = torch.softmax(self.fc(state), dim=-1) return action_probs # 初始化参数 input_dim = 4 # 输入维度大小 output_dim = 2 # 输出动作空间数量 learning_rate = 0.01 policy_net = PolicyNetwork(input_dim, output_dim) optimizer = optim.Adam(policy_net.parameters(), lr=learning_rate) def select_action(state): state_tensor = torch.tensor([state], dtype=torch.float32) probs = policy_net(state_tensor).detach().numpy() action = np.random.choice(output_dim, p=probs[0]) return action ``` 此脚本仅作为一个基本示例提供给读者参考,具体应用时还需要考虑更多因素如环境交互逻辑等。 --- ### 总结 虽然 `null` 在不同上下文中有着不同的解释方式,但它并不会干扰我们探索现代 AI 工具集的过程。如果想深入研究结合 PyTorch 的强化学习技术栈,上述资源应该能为您提供良好的开端。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值