开源项目推荐:Off-Policy Multi-Agent Reinforcement Learning Algorithms
1. 项目基础介绍及主要编程语言
本项目是Marlbenchmark团队在GitHub上开源的一个项目,项目地址为 https://github.com/marlbenchmark/off-policy.git。该项目提供了多种离策略多智能体强化学习算法的PyTorch实现,主要编程语言为Python。
2. 项目的核心功能
该项目支持以下几种流行的离策略多智能体强化学习算法:
- MADDPG(多层感知器和递归神经网络版本)
- MATD3(多层感知器和递归神经网络版本)
- QMIX(多层感知器和递归神经网络版本)
- VDN(多层感知器和递归神经网络版本)
同时,该项目支持以下环境:
- StarCraftII(SMAC)
- 多智能体粒子世界环境(MPEs)
项目中的核心代码位于offpolicy
文件夹中,算法特定的代码位于algorithms/
子文件夹内。项目还支持优先级经验回放(PER)。
3. 项目最近更新的功能
根据项目的更新日志,最近的更新主要包括:
- 对QMIX和MADDPG算法进行了彻底的测试。
- 对VDN和MATD3实现进行了小规模的修改,分别基于QMIX和MADDPG进行了调整。
- 提供了默认参数下的训练脚本,方便用户快速开始训练。
- 支持了稳定的学习环境设置,如SMAC地图和稳定ID的配置。
- 通过添加命令行参数
--use_wandb
,可以使用Tensorboard替代Weights & Biases作为可视化平台。
项目持续更新中,不断优化算法实现和增强用户体验。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考