强化学习资料汇总和一些个人心得

本文汇总了适合初学者的强化学习中文资源,包括知乎专栏‘强化学习知识大讲堂’、‘莫烦’和‘智能单元’,提供了关于同策略、异策略、行动策略和重要性采样的学习链接,以及DQN的详细解析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        最近开始接触强化学习,买了一些参考书,也在网上看了很多大神写的文章。现在把自己在网络上看到的比较好的资料汇总一下,方便日后自己查阅,也希望能帮助到一些初学者。由于本人的英文不是太好,所以看的资料基本都是中文的,如果有一定基础的同学,还是建议多看国外大神的博客和论文。

       首推知乎专栏--强化学习知识大讲堂

       这个专栏里内容比较全面,把强化学习领域里两大分支--值函数法和策略梯度法都进行了比较详细的介绍,同时也举了一些基于python的编程实例,把这个专栏认真看完,基本就能掌握大部分强化学习的知识了。专栏作者还出了书《深入浅出强化学习》,书里的内容基本就是专栏里的文章,喜欢看书学习的同学可以买一本,也算是支持下作者,毕竟原创不易。

       其次推荐一个知乎专栏--莫烦

       这个专栏偏重于编程实践,原理讲得并不深入,没有复杂的数学推导,非常适合初学者快速理解不同的强化学习方法,但是个人感觉有些东西作者讲得并不是很清楚,需要查阅其它资料帮助理解。这里推荐访问作者的个人网站--莫烦python,网站里涵盖了专栏里的内容,作者也把源码都放在github里了,简直是良心作者。同时网站里还有其它机器学习的内容,真是要给作者十万个赞!

       再推荐一个知乎专栏--

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值