2、强化学习入门

脑补型产品

于 2025-10-07 11:20:08 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：深度强化学习入门指南文章标签：强化学习马尔可夫决策过程智能体

本文链接：https://blog.youkuaiyun.com/mongodb5scout/article/details/154598501

深度强化学习入门指南专栏收录该内容

35 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

强化学习入门

1. 致谢与作者介绍

有许多人帮助完成了相关项目。感谢 Milan Cvitkovic、Alex Leeds、Navdeep Jaitly、Jon Krohn、Katya Vasilaky 和 Katelyn Gleason 的支持与鼓励。也感谢 OpenAI、PyTorch、Ilya Kostrikov 和 Jamromir Janisch 提供深度强化学习算法不同组件的高质量开源实现。同时感谢 Arthur Juliani 关于环境设计的早期讨论。

还有很多人对早期草稿提供了有见地的反馈，包括 Alexandre Sablayrolles、Anant Gupta 等众多人士。此外，非常感谢 Pearson 制作团队的精心付出，让文本质量有了很大提升。最后，要感谢编辑 Debra Williams Cauley 的耐心、鼓励以及帮助实现了创作。

作者 Laura Graesser 是谷歌从事机器人研究的软件工程师，拥有纽约大学计算机科学硕士学位，专注于机器学习。Wah Loon Keng 是 Machine Zone 的 AI 工程师，将深度强化学习应用于工业问题，有理论物理和计算机科学背景。他们共同开发了两个深度强化学习软件库，并就该主题进行了多次演讲和教程分享。