强化学习族谱

本文档汇总了深度强化学习领域的关键技术和研究成果,包括策略梯度方法、探索策略、Actor-Critic方法及其与生成对抗网络和其他方法之间的联系,并探讨了在多智能体环境中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

https://github.com/tigerneil/deep-reinforcement-learning-family

deep-reinforcement-learning-records

Landscape of DRL/GANExplicitly show the relationships between various techniques of deep reinforcement learning methods.

Dedicated for learning and researching on DRL.

Policy gradient methods

Explorations in DRL

Actor-Critic methods

Connection with other methods

Connecting value and policy methods

Unifying

Faster DRL

Apply RL to other domains

Multiagent Settings


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值