- 博客(9)
- 收藏
- 关注
原创 远程服务器python运行及管理方法
登录远程服务器后启动python程序,当关闭终端时相应python程序会终止。这里记录1.如何在linux的远程服务器上运行不随终端关闭而终止的python程序2.再次打开终端如何管理之前未终止程序并进行终止操作 Q1.如何在linux的远程服务器上运行不随终端关闭而终止的python程序 打开连接远程服务器的终端 conda inf...
2019-01-15 17:46:01
2239
1
原创 google免费GPU使用经历记录
听说Google提供免费的GPU加速了,通读相关教程https://medium.com/deep-learning-turkey/google-colab-free-gpu-tutorial-e113627b9f5d,但由于我比较操作废,在网上也找不到更加详尽的教程,磕磕绊绊折腾半天,终于可以成功使用,赶紧记录下来每一步的操作吧。1.找到google drive:在chrome浏览器中输入网...
2018-08-22 18:36:36
5051
1
翻译 揭秘深度强化学习-7DQN的一些小技巧
看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/经验回放(Experience Replay)至今我们已经知道如何通过Q-learning和近似Q函数的CNN来评估任一状态的未来奖励。但是关于Q值的渐近使用的是非线性函数并不稳定。这里有一...
2018-08-09 10:16:36
817
1
翻译 揭秘深度强化学习-6状态空间过大之神经网络来帮忙
看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/DQN上回书咱们说到,当状态和动作很小时,我们可以用表结构来记录Q值。再捡起我们的打砖块游戏,它的环境中的状态,可以被定义为平板位置,球的位置和方向,每个独立砖块的存在性。然而,这个直觉...
2018-08-08 17:26:48
4420
翻译 揭秘深度强化学习-5 评估奖励之Q-learning算法
看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/Q-learning算法在Q-learning算法中,我们定义一个函数Q(s,a) 来表示当我们在状态s采取行动a且之后都是最理想状态,我们预期未来能获得的衰减未来奖励Q(s,a)可...
2018-08-08 16:40:12
4621
翻译 揭秘深度强化学习-4长期策略之衰减因子
看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/衰减未来奖励(Discounted Future Reward)为了在周期很长的游戏中同样表现出色,我们需要考虑的不仅仅是当下即时奖励,同样还有未来我们能够得到的。那么我们该如何做呢?假...
2018-08-08 15:53:00
4920
翻译 揭秘深度强化学习-3强化学习理论依据——马尔科夫决策过程
看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/马尔科夫决策过程(Markov Decision Process)现在我们来看看如何构造一个强化学习问题的公式。最常用的是基于马尔科夫决策过程(Markov decision process...
2018-08-08 15:28:16
542
翻译 揭秘深度强化学习-2强化学习主要挑战
看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/回忆一下童年游戏打砖块(Breakout)。在这个游戏中,玩家通过控制一根屏幕上的平板,让一颗不断弹来弹去的“球”在撞击作为过关目标消去的“砖块”的途中不会落到屏幕底下,每当球撞到一个砖块,砖块...
2018-08-08 14:27:56
1096
翻译 揭秘深度强化学习-1简述
看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/某年某月某一天,DeepMind在Arxiv上发表论文“Playing Atari with Deep Reinforcement Learning”。在这篇论文中,他们证明了一台计算机是如...
2018-07-24 11:14:58
405
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人