
RL
文章平均质量分 81
z0n1l2
这个作者很懒,什么都没留下…
展开
-
增强学习的标准“数据集”GYM
源Gym是开发和对比强化学习算法的工具,对算法agent结构没有限制,兼容很多计算库,比如TensorFlow,Theano。 Gym包括很多可用来测试强化学习的测试环境,支持统一的接口。Installation要求python版本不低于3.5,通过pip安装pip install gymBuilding from Sourcegym代码在github上开源,...翻译 2018-08-04 22:11:39 · 2144 阅读 · 0 评论 -
DRL-FlappyBird
在github上分析了一个FlappyBird的DQN项目,把项目逻辑记录下来,加深DQN的理解。 PS: 跟踪到原始的github项目,可以找到几篇很经典的文献,有助于加深理解图中矩形框标识数据内容,关键的几个模块 1. Environment 算法目标环境,此处就是flappy bird游戏,这个模块接受算法给出的action,返回reward。这个reward可以看作一个...原创 2018-08-07 00:15:51 · 643 阅读 · 0 评论