
学习笔记
文章平均质量分 93
Na_Lv
这个作者很懒,什么都没留下…
展开
-
强化学习的数学原理(6-7)
随机近似理论和随机梯度下降;时序差分方法(TD、Sarsa、Q-Learning)原创 2023-12-15 15:27:38 · 1425 阅读 · 0 评论 -
强化学习的数学原理(4-5)
第四课主要介绍了model-based问题的求解方法:Value Iteration 和 Policy Iteration,第五课主要介绍了model-free问题的求解方法: Monte Carlo Algorithm原创 2023-12-12 15:29:34 · 957 阅读 · 0 评论 -
强化学习的数学原理(1-3)
本课程笔记参考(西湖大学智能无人系统实验室-赵世钰)https://www.bilibili.com/video/BV1sd4y167NS/?spm_id_from=333.337.search-card.all.click原创 2023-12-10 20:32:07 · 1271 阅读 · 1 评论