强化学习
文章平均质量分 89
写Bug那些事
开始学习!!!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Policy-based Reinforcement learning
强化学习这一章会讲基于策略的强化学习Value-Based Reinforcement Learning-DQN强化学习前言一、policy函数二、DQN2.1 游戏中agent的目标是什么?2.2 agent如何做决策?2.3 如何理解Q* 函数呢?2.5 DQN打游戏?三、如何训练DQN?3.1 TD算法3.2 TD算法训练DQN四、训练步骤六、总结前言说明一下:这是我的一个学习笔记,课程链接如下:最易懂的强化学习课程公众号:AI那些事一、policy函数我们回顾一下Acti原创 2021-08-22 21:14:23 · 5706 阅读 · 4 评论 -
Value-Based Reinforcement Learning-DQN
强化学习这一章会讲DQN算法,并且用TD算法来训练DQN。强化学习入门这一篇就够了强化学习前言一、Action-Value Functions二、DQN2.1 游戏中agent的目标是什么?2.2 agent如何做决策?2.3 如何理解Q* 函数呢?2.5 DQN打游戏?三、如何训练DQN?3.1 TD算法3.2 TD算法训练DQN四、训练步骤六、总结前言说明一下:这是我的一个学习笔记,课程链接如下:最易懂的强化学习课程公众号:AI那些事一、Action-Value Functio原创 2021-08-11 23:08:41 · 8821 阅读 · 18 评论 -
强化学习入门这一篇就够了!!!万字长文
强化学习强化学习入门这一篇就够了万字长文带你明明白白学习强化学习...强化学习入门这一篇就够了强化学习前言一、概率统计知识回顾1.1 随机变量和观测值1.2 概率密度函数1.3 期望1.4 随机抽样二、强化学习的专业术语2.1 State and action2.2 policy-策略2.3 reward2.4 状态转移2.5 agent与环境交互三、强化学习的随机性3.1 动作随机3.2 状态转移的随机性四、如何让AI自动打游戏?五、强化学习基本概念5.1 Return5.2 价值函数5.3 Q~原创 2021-08-06 14:10:03 · 162807 阅读 · 96 评论 -
强化学习入门
强化学习 强化学习...原创 2021-07-10 10:56:22 · 2528 阅读 · 9 评论
分享