强化学习导论第二版

本文介绍了作者在GitHub上整理Sutton和Barto的强化学习经典教材《Reinforcement Learning: An Introduction (2nd Edition)》的过程,包括中文翻译、代码实现、问题答疑和习题解答等内容。该书虽出版于2018年,但作者近期才开始深入学习,并计划根据个人节奏不定期更新。提供了多个参考资料链接以供进一步学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我的GitHub正在整理Sutton和Barto的书籍Reinforcement Learning: An Introduction (2nd Edition),其中包括书籍的中文翻译、代码、疑问和习题答案等。

这本书是强化学习入门的经典教材,虽然这本书2018年就已经出版,但是前两年我一直忙于课题研究,没有静下心来看这本书。最近一个月才打算看这本书,因为没看这本书总觉得对强化学习这个领域的了解少了些什么。

因为没有要求自己什么时间之前必须看完,所以我会根据自己的节奏不定时更新。我会更精确(尽自己所能)地翻译这本书,然后整理出我在书中遇到的各种疑问,同时给出书中习题的答案。更多的信息请前往我的GitHub查看。

参考资源

习题解答

[1] 优快云-Reinforcement Learning: An Introduction 2nd solutions (第二版 答案)
[2] GitHub-JKCooper2/rlai-exercises

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值