
强化学习系列
Greepex
复旦大学硕士在读
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pytorch一些不常见函数解析(持续更新)
1. Categorical()torch.distributions.Categorical()可以按照一定概率产生具体数字,比如:import torchfrom torch.distributions import Categoricalrand = Categorical(torch.tensor([0.25,0.25,0.25,0.25]))print(rand.sam...原创 2019-12-09 21:58:00 · 3587 阅读 · 0 评论 -
深度强化学习资料汇总(持续更新)
学习目录1. 强化学习基础1. 强化学习基础[1] Q-Learning(中文)[1] Q-Learning(英文)[2] DQLearning(英文):let’s play Doom[2] DQLearning(中文):let’s play Doom(上)[2] DQLearning(中文):let’s play Doom(下)[3] 以Cartpole和Doom为例介绍策略梯度(...原创 2019-11-30 15:28:11 · 625 阅读 · 0 评论