
深度学习
文章平均质量分 56
古道西风瘦码
2021级大头。
展开
-
pycharm配置解释器
可以配置多个pycharm解释器原创 2022-12-11 11:39:49 · 160 阅读 · 0 评论 -
策略梯度算法的理解
文章目录前言一、来源?1. DQN的缺陷二、使用步骤1.引入库2.读入数据总结前言策略梯度(Policy Gradient, PG)的通俗介绍。一、来源?1. DQN的缺陷深度学习是监督学习,需要有标签数据来计算损失函数,通过梯度下降和误差反向传播来更新神经网络的参数,那在强化学习中如何获得标签呢?Rt+1+γmaxaQ(St+1,a;θ) R_{t+1}+\gamma \underset{a}{\max}Q\left( S_{t+1},a;\theta \right) Rt+1+γ原创 2022-04-16 22:23:59 · 1219 阅读 · 0 评论 -
pytorch和GPU
文章目录前言一、pytorch是什么?二、使用步骤1.引入库2.构建基本数据总结前言pytorch调用GPU一、pytorch是什么?通俗的讲,里面包括众多深度学习模块,简单使用过后就入门了。二、使用步骤1.引入库代码如下(示例):import torch# todo 判断GPU是否可用use_gpu = torch.cuda.is_available()2.构建基本数据包括一些训练集,分别用trX和trY表示,模型用model表示trX = torch.Tensor([原创 2022-04-13 09:41:42 · 1145 阅读 · 0 评论