自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

江南才尽江南山,年少无知年少狂!

愿你十载归来,你仍年少依旧狂,那时漫天枫叶书窗前,笔墨深秋锁江南!

01.强化学习理论基础

文章平均质量分 93
该系列博客,主要对强化学习: 基本概念(如:状态、动作、奖励、策略等) 数学原理(如:马尔可夫决策过程、贝尔曼方程、值函数、策略梯度等) 经典网络(如:PPO、TD3、SAC、Q-learning 等) 进行深入简介,每个知识点分白话通俗与公式推导证明两个部分,由浅入深。
关注数:5 文章数:47 文章阅读量:32586 文章收藏量:729

作者: 江南才尽,年少无知!

志在九天不为乡愁换白发,偏偏年少白衣博天涯!
展开

专栏收录文章