强化学习
c-minus
对机器学习、深度学习等领域方面的研究颇有兴趣
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
强化学习: 贝尔曼方程与马尔可夫决策过程
强化学习: 贝尔曼方程与马尔可夫决策过程一、简介贝尔曼方程和马尔可夫决策过程是强化学习非常重要的两个概念,大部分强化学习算法都是围绕这两个概念进行操作。尤其是贝尔曼方程,对以后理解蒙特卡洛搜索、时序差分算法以及深度强化学习算法都至关重要。这篇文章主要介绍贝尔曼方程。常用的资料:《Reinforcement Learning: An Introduction》 author: Richard S.Sutton and Andrew G.BartoUCL Course: https://www.dav原创 2020-12-18 21:06:07 · 4156 阅读 · 3 评论 -
强化学习:强化学习简介
强化学习:强化学习简介一、简介 由于工作和研究的需要,不得不接触一部分的强化学习课程。而强化学习系列大部分原理都涉及到相当多的数学原理,啃起来也比较麻烦。我在学习的过程中,也是参考了多方资料,整个系列看下来,深感只有真正动手coding才能理解到强化学习的精髓吧。但碍于时间的限制,我并没有真正的去动手编程,而是粗略的去阅读了别人的源码,这一部分欠缺,等日后有时间了再补上去。 常用的资料: 《Reinforcement Learning: An Introduction》 autho原创 2020-12-15 19:35:27 · 667 阅读 · 0 评论
分享