
强化学习
TangowL
这个作者很懒,什么都没留下…
展开
-
深度强化学习(文献篇)—— 从 DQN、DDPG、NAF 到 A3C
自己第一篇 paper 就是用 MDP 解决资源优化问题,想来那时写个东西真是艰难啊。 彼时倒没想到这个数学工具,如今会这么火,还衍生了新的领域——强化学习。当然现在研究的内容已有了很大拓展。 这段时间会做个深度强化学习的专题,包括基础理论、最新文献和实践三大部分。...原创 2018-09-02 18:45:55 · 18003 阅读 · 4 评论 -
深度强化学习(理论篇)—— 从 Critic-only、Actor-only 到 Actor-Critic
这段时间会做个深度强化学习的专题,包括理论、文献和实践三大部分。原创 2018-08-12 22:52:07 · 7806 阅读 · 6 评论