
强化学习
文章平均质量分 94
YZXnuaa
乍见之欢不如久处不厌
展开
-
2017年深度学习必读31篇论文
2017年即将擦肩而过,Kloud Strife在其博客上盘点了今年最值得关注的有关深度学习的论文,包括架构/模型、生成模型、强化学习、SGD & 优化及理论等各个方面,有些论文名扬四海,有些论文则非常低调。一如既往,首先,标准免责声明适用,因为今年仅与GAN有关的论文就超过1660篇。我肯定会有疏漏,试图缩减到每两周一篇论文,包含了Imperial Deep Learning Readi...转载 2018-03-23 11:12:30 · 1484 阅读 · 0 评论 -
强化学习与简单多臂老虎机问题
基础 我在 series hub 中介绍过最基本的强化学习的内容。在强化学习里有四个基本的概念会经常出现在相关的文章中,策略、奖励、价值函数以及环境模型。我会跳过模型这个部分,因为我们现在讨论的是不基于模型的学习理论。 策略:是强化学习机的核心,代表着决策进行的方式。它可能是一个表格,一个函数或者一个复杂的深度神经网络。 奖励信号:一个数值,代表着强化学习机采取行动后的即时奖励。最...原创 2018-03-21 16:08:47 · 2210 阅读 · 0 评论