学习笔记:强化学习与最优控制
文章平均质量分 87
gongchenooo
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
学习笔记:强化学习与最优控制(Chapter 2)
Approximation in Value Space学习笔记:强化学习与最优控制(Chapter 2)Approximation in Value Space2.1 approximation method如我们之前所说,最优控制问题虽然可以用动态规划来解决,但是要求所有状态xkx_kxk的optimal cost-to-go需要花费很长的时间,所以有着各种各样的approximation方法。2.1 approximation method在动态规划求解最优控制的过程中,有两种估计方法:原创 2021-07-13 11:15:54 · 1597 阅读 · 1 评论 -
学习笔记:强化学习与最优控制(Chapter 0)
学习笔记:强化学习与最优控制(Chapter 0)1. Model-based vs Model-free本章简单介绍一些强化学习中的概念,推荐先看Chapter1了解一下强化学习的一些数学表达式子。1. Model-based vs Model-free一个finite horizon动态规划问题是由以下几个参数定义的:状态xkx_kxk,控制uku_kuk,扰动(disturbance)wkw_kwk及其分布,代价函数gk(xk,uk,wk)g_k(x_k,u_k,w_k)gk(xk,原创 2021-07-11 17:25:13 · 956 阅读 · 0 评论 -
学习笔记:强化学习与最优控制(Chapter 1)
学习笔记:强化学习与最优控制(Chapter 1)1.1 Deterministic Programming1.1.1 Deterministic Problems本博客参考课本Reinforcement Learning and Optimal Control,由Dimitri P. Bertsekas书写1.1 Deterministic Programming1.1.1 Deterministic Problemsfinite horizon problems: 包含有限的决策序列dete原创 2021-07-11 11:33:58 · 1740 阅读 · 0 评论
分享