
Reinforcement Learning
pyxiea
双鸭山大学研究生,对深度学习、自然语言处理、推荐系统感兴趣
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
强化学习入门
英文能力好的童鞋建议看原版视频,B站地址:https://www.bilibili.com/video/av39548965/ 看8-11集即可。看的过程会遇到一些前面章节提到的概念,例如minimax算法,忽略即可,对于总体理解强化学习并不影响。 Marcov Decision Processes(MDP,马尔科夫决策过程) Reinforcement Learning(RL,强化学习) 小结...原创 2019-06-20 11:46:46 · 2888 阅读 · 0 评论 -
Boltzmann/Softmax Exploration Strategy
Boltzmann/Softmax Exploration Strategy 玻尔兹曼探索策略 转自: Google图书 《The Logic of Adaptive Behavior》转载 2019-09-17 12:30:08 · 3916 阅读 · 1 评论 -
module 'gym' has no attribute 'benchmark_spec'
新版本的gym移除了benchmark_spec,见 issue 解决办法:安装旧版本的gym。 具体做法: 按照 这篇博客 下载2017年的gym源码(我下载的是17年2月的)。 按照这篇博客 ,从源码安装gym。我使用的是pip install -e . (注意有个英文句号) ...原创 2019-09-22 20:21:24 · 2558 阅读 · 0 评论