开源项目推荐:Off-Policy Multi-Agent Reinforcement Learning Algorithms

开源项目推荐:Off-Policy Multi-Agent Reinforcement Learning Algorithms

off-policy PyTorch implementations of popular off-policy multi-agent reinforcement learning algorithms, including QMix, VDN, MADDPG, and MATD3. off-policy 项目地址: https://gitcode.com/gh_mirrors/of/off-policy

1. 项目基础介绍及主要编程语言

本项目是Marlbenchmark团队在GitHub上开源的一个项目,项目地址为 https://github.com/marlbenchmark/off-policy.git。该项目提供了多种离策略多智能体强化学习算法的PyTorch实现,主要编程语言为Python。

2. 项目的核心功能

该项目支持以下几种流行的离策略多智能体强化学习算法:

  • MADDPG(多层感知器和递归神经网络版本)
  • MATD3(多层感知器和递归神经网络版本)
  • QMIX(多层感知器和递归神经网络版本)
  • VDN(多层感知器和递归神经网络版本)

同时,该项目支持以下环境:

  • StarCraftII(SMAC)
  • 多智能体粒子世界环境(MPEs)

项目中的核心代码位于offpolicy文件夹中,算法特定的代码位于algorithms/子文件夹内。项目还支持优先级经验回放(PER)。

3. 项目最近更新的功能

根据项目的更新日志,最近的更新主要包括:

  • 对QMIX和MADDPG算法进行了彻底的测试。
  • 对VDN和MATD3实现进行了小规模的修改,分别基于QMIX和MADDPG进行了调整。
  • 提供了默认参数下的训练脚本,方便用户快速开始训练。
  • 支持了稳定的学习环境设置,如SMAC地图和稳定ID的配置。
  • 通过添加命令行参数--use_wandb,可以使用Tensorboard替代Weights & Biases作为可视化平台。

项目持续更新中,不断优化算法实现和增强用户体验。

off-policy PyTorch implementations of popular off-policy multi-agent reinforcement learning algorithms, including QMix, VDN, MADDPG, and MATD3. off-policy 项目地址: https://gitcode.com/gh_mirrors/of/off-policy

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

牧爱颖Kelvin

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值