
强化学习
文章平均质量分 94
Icesuns
没有对象的野指针
展开
-
reinforcement-learning-1
转载于icesuns的《Reinforcement Learning(1)》强化学习简介强化学习(英语:Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。强化学习涉及很多学科,...原创 2018-06-04 14:41:16 · 345 阅读 · 1 评论 -
20180610-reinforcement-learning-MDP
【转自本人个人博客 icesuns】 Reinforcement Learning(2)——MDPs 上一篇文章强化学习——简介简单介绍了一下强化学习的相关概念。这篇博客将引入 马尔科夫决策过程(Markov Decision Processes, MDPs)对强化学习进行建模。这篇文章,将对马尔科夫决策过程以及Q-leaning进行介绍。马尔科夫过程 定义: 若随机过程 {Xn,...原创 2018-06-15 10:15:21 · 319 阅读 · 0 评论