
强化学习
可可亚西村的橘子
这个作者很懒,什么都没留下…
展开
-
强化学习 ---baselines项目之 Atari游戏的网络结构解析
这个baselines项目设计的比较灵活,结构有点复杂。由于项目庞大,各个函数之间又是相互调用,有时候从一个函数追溯下去,可以追溯6,7层,每个函数的超参数又特别多,很容易把人搞晕。 接下来只看DQN部分的源码,其他无关的先不看,沿着一条线分解它! 接下来进行一个递归游戏,一层一层的深入探索。 在deepq下有个experiments,...原创 2020-02-22 16:54:52 · 1855 阅读 · 0 评论 -
强化学习 --baseline项目之gym中的Atari游戏的环境重写
gym中集成的atari游戏可用于DQN训练,但是操作还不够方便,于是baseline中专门对gym的环境重写,以更好地适应dqn的训练 从源码中可以看出,只需要重写两个函数 reset()和step() ,由于render()没有被重写,所以画面就没有被显示出来了 1.NoopResetEnv()函数,功能:前30帧画面什么都不做,跳过。这有利于...原创 2020-02-19 16:32:37 · 5198 阅读 · 1 评论 -
强化学习 baselines项目源码部分解读
最近发现强化学习挺有意思,但是发现这样的博客挺少的,就随手记录下学习的过程! Google的DeepMind团队专门致力于研究人工智能,当然在强化学习领域也是世界领先水平,在2015年,DeepMind团队在nature杂志上发表了一片名为《Human-level control through deep reinforcement learning》的论文,第一个成功将强化学习和深度学习结合起来...原创 2020-02-19 11:03:22 · 1545 阅读 · 5 评论 -
强化学习 ---baseline项目之 TensorFlow的训练参数的存储和加载
该项目中把tf的数据存储和读取抽取出两个函数,方便开发,思想和代码值得借迁 一.存储 def save_variables(save_path, variables=None, sess=None): import joblib sess = sess or get_session() ...原创 2020-02-19 11:41:30 · 1059 阅读 · 1 评论