强化学习
文章平均质量分 80
学习一些强化学习的内容,此处记录一些笔记。
庄园特聘拆椅狂魔
每天焦虑一遍,如何变成学术大佬呀| ᴥ•́ )✧
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【强化学习高阶技巧】Experience Replay经验回报
强化学习相关的高阶技巧Experience Replay经验回报的介绍。此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-09-08 17:20:36 · 813 阅读 · 0 评论 -
【Multi-Step TD Target】TD算法的改进
强化学习相关的TD算法改进的介绍。此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-09-01 21:13:46 · 563 阅读 · 0 评论 -
【Q-Learning】TD算法的一种
强化学习相关的Q-Learning算法的介绍。此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-09-01 20:09:22 · 712 阅读 · 0 评论 -
【Saras算法】TD Learning的一种
强化学习相关的Sarsa算法的介绍。此处笔记根据B站课程,王树森老师的强化学习记录而来。Sarsa算法是TD算法的一种,名字来源于 需要观测的五元组(s(t), a(t), r(t), s(t+1), a(t+1)),即 State-Action-Reward-State-Action ,简称SARSA。...原创 2022-09-01 16:50:09 · 926 阅读 · 0 评论 -
【Reinforcement Learning】蒙特卡洛算法
强化学习相关的蒙特卡洛算法的介绍。此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-09-01 11:04:37 · 846 阅读 · 0 评论 -
【Reinforcement Learning】AlphaGo 如何使用的强化学习?
以 AlphaGo模型来讲解在实际应用中如何使用强化学习。此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-08-31 12:51:40 · 2568 阅读 · 0 评论 -
【Reinforcement Learning】actor-critic学习
强化学习最主要的两种方式的融合,actor-critic的究竟是怎么回事?此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-08-30 15:58:52 · 552 阅读 · 0 评论 -
【Reinforcement Learning】策略学习
强化学习最主要的两种方式之一,策略学习的究竟是怎么回事?此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-08-30 00:30:45 · 325 阅读 · 0 评论 -
【Reinforcement Learning】价值学习
强化学习最主要的两个方法之一,价值学习的究竟是怎么回事?此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-08-29 18:27:27 · 313 阅读 · 0 评论 -
【Reinforcement Learning】强化学习基础内容有哪些?
强化学习入门笔记,互勉,共同学习。强化学习基础内容有哪些?此处笔记根据B站课程,王树森老师的强化学习记录而来。原创 2022-08-29 15:21:26 · 380 阅读 · 0 评论
分享