自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Promising0321的博客

博客等级

码龄8年

9
原创

18
点赞

45
收藏

30
粉丝

关注

私信

热门文章

分类专栏

增强学习思想整理 5篇
AlphaGo系列整理 2篇

最新评论

Reinforcement Learning——DP
soniccc_: 博主太棒了，完美概括David Silver的课程，大大提升学习效率！
策略梯度算法
Andromeda_J 回复启明菲: bilibili
策略梯度算法
启明菲: 请问博主，文中提到的视频课在哪可以看
值函数近似——Large MDPs 的福音
Jamie_ha: 你好，我想问一下梯度下降法与SARSA有什么关系？是两者都可以解决这个值函数近似的问题吗？我对一个复杂函数进行值函数近似，并且求解，我将它进行分段线性之后再采用随机梯度下降法对函数进行逼近不可以吗？（我记得随机梯度也是可以对函数进行逼近以及更新的）
Reinforcement Learning——MDP
杨念一: 优秀耶，超容易哒！

AlphaGo系列整理

关注

文章平均质量分 80

关注数：文章数：2 文章阅读量：1786 文章收藏量：2

作者: Andromeda_J

这个作者很懒，什么都没留下…

展开

专栏收录文章