
强化学习系列
Greepex
复旦大学硕士在读
展开
-
Pytorch一些不常见函数解析(持续更新)
1. Categorical() torch.distributions.Categorical() 可以按照一定概率产生具体数字,比如: import torch from torch.distributions import Categorical rand = Categorical(torch.tensor([0.25,0.25,0.25,0.25])) print(rand.sam...原创 2019-12-09 21:58:00 · 3537 阅读 · 0 评论 -
深度强化学习资料汇总(持续更新)
学习目录1. 强化学习基础 1. 强化学习基础 [1] Q-Learning(中文) [1] Q-Learning(英文) [2] DQLearning(英文):let’s play Doom [2] DQLearning(中文):let’s play Doom(上) [2] DQLearning(中文):let’s play Doom(下) [3] 以Cartpole和Doom为例介绍策略梯度(...原创 2019-11-30 15:28:11 · 587 阅读 · 0 评论