
强化学习
文章平均质量分 90
trillion_power
这个作者很懒,什么都没留下…
展开
-
强化学习(reinforcement learning)学习笔记(二)——值迭代与策略迭代
上一次我分享了强化学习相关基础概念,推导了Bellman方程。这次我们来学习求解强化学习模型的2种思路——值迭代与策略迭代动态规划这里面我要简单介绍一下动态规划,因为严格来说,值迭代与策略迭代是用来解决动态规划问题的两种规划方法。而强化学习又有另外一个昵称——就是拟动态规划。说白了强化学习就是模拟动态规划算法。用一句话来总结动态规划就是,对一个复杂问题给出一个一般性的解决办法。它主要由两个性质:最原创 2017-12-29 20:02:03 · 14570 阅读 · 4 评论 -
强化学习学习笔记——介绍强化学习(reinforcement learning)
众所周知,当AlphaGO战胜了世界围棋冠军李世石之后,整个工业界都为之振奋,越来越多的学者意识到强化学习在人工智能领域是一个非常令人exciting的。在此我就分享一下本人的强化学习学习笔记。强化学习基本概念机器学习可以分为三类,分别是 supervised learning,unsupervised learning 和reinforcement learning。而强化学习与其他机器学习不同之原创 2017-04-30 09:14:58 · 50835 阅读 · 3 评论