- 博客(2)
- 收藏
- 关注
原创 强化学习深入浅出完全教程-郭宪-专题视频课程
深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。...
2018-02-24 16:27:38
1634
原创 强化学习入门第一讲 马尔科夫决策过程
本节是强化学习基础课程的第一节课马尔科夫决策过程。强化学习问题可以利用马尔科夫决策过程来表述,本节详细阐述了该框架,是掌握强化学习思想最基础的概念。
2017-03-13 21:12:30
2063
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人