强化学习
文章平均质量分 90
roman_日积跬步-终至千里
做三四月的事,在八九月自有答案。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【强化学习基础(6)】强化学习的应用:从游戏到机器人
【强化学习基础(6)】强化学习的应用:从游戏到机器人原创 2025-11-25 22:58:56 · 1021 阅读 · 0 评论 -
【强化学习基础(5)】策略搜索与学徒学习:从专家行为中学习加速学习过程
【强化学习基础(5)】策略搜索与学徒学习:从专家行为中学习加速学习过程原创 2025-11-25 13:20:32 · 618 阅读 · 0 评论 -
【强化学习基础(4)】强化学习中的泛化:函数近似与深度强化学习
【强化学习基础(4)】强化学习中的泛化:函数近似与深度强化学习原创 2025-11-25 13:13:09 · 745 阅读 · 0 评论 -
【强化学习基础(3)】主动强化学习:不仅要评估还要决策,探索与利用的平衡
【强化学习基础(3)】主动强化学习:不仅要评估还要决策,探索与利用的平衡原创 2025-11-25 13:06:31 · 1046 阅读 · 0 评论 -
【强化学习基础(2)】被动强化学习:学习价值函数
被动强化学习(Passive Reinforcement Learning)是指智能体有一个固定的策略π(s),它按照这个策略行动,学习状态的价值函数U(s)。价值函数表示"从状态s开始,按照策略π,期望能获得多少累积奖励"。在被动学习中,智能体不知道环境的转移模型P(s’|s, a)和奖励函数R(s, a, s’)。它只能通过观察来学习:执行动作,观察结果状态和奖励,然后更新对状态价值的估计。这就像你按照既定路线开车,不知道路况如何,只能通过实际开车来观察"这条路好不好走"。原创 2025-11-25 12:57:34 · 540 阅读 · 0 评论 -
【强化学习基础】强化学习概念:从奖励中学习
【强化学习基础】强化学习概念:从奖励中学习原创 2025-11-24 23:47:28 · 781 阅读 · 0 评论
分享