强化学习经典算法笔记(十六):Policy Gradient算法家族
在学习Soft Actor-Critic,SAC算法时,发现了一篇非常好的文章,比较全面地介绍了策略梯度算法家族。文章的作者是在OpenAI工作的Lilian Weng小姐姐,佩服至极!!
文章链接:
Policy Gradient Algorithms
为了系统地学习一下,我决定翻译一下,尽管已经有了中文版。
先占个坑。
本文通过翻译LilianWeng在OpenAI的工作成果,全面介绍策略梯度算法家族,重点解析SoftActor-Critic(SAC)算法,为读者提供深入理解强化学习经典算法的宝贵资源。
在学习Soft Actor-Critic,SAC算法时,发现了一篇非常好的文章,比较全面地介绍了策略梯度算法家族。文章的作者是在OpenAI工作的Lilian Weng小姐姐,佩服至极!!
文章链接:
Policy Gradient Algorithms
为了系统地学习一下,我决定翻译一下,尽管已经有了中文版。
先占个坑。
852
3074
2440
1989

被折叠的 条评论
为什么被折叠?