MARLlib 强化学习新的Benchmark

最新推荐文章于 2025-03-04 22:35:19 发布

为你，千千万万遍

最新推荐文章于 2025-03-04 22:35:19 发布

阅读量1.9k

点赞数 2

分类专栏：强化学习文章标签：神经网络人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42903952/article/details/128232491

版权

强化学习专栏收录该内容

5 篇文章

订阅专栏

最近在读文献的时候发现了一个新的强化学习Benchmark：MARLlib。论文名称为：MARLlib: Extending RLlib for Multi-agent Reinforcement Learning。下来对论文和代码库做一个简要的介绍：

MARLlib论文

作者在论文当中主要针对提出的MARLlib进行了介绍，并和其他现有的Benchmark做了比较，文章值的学习的地方是对现有的算法进行了详细的分析和分类，针对每一类算法的特点，对强化学习算法的使用提供了明确的方向，对每一类任务模式都贴上了相应的标签，并且支持10多种环境、18种算法、支持异步采样。

Task mode

代码库提供了多种任务模式，包括cooperative、collaborative、competitive、mixed多种任务模式，能够方便广大研究者对确切的环境模式进行选择。

Algorithm

文章对现有的算法进行了明确的分类，将现有的算法大致分为 Independent Learning 、Centralized Critic 、Value Decomposition 三种。

框架

算法

值的一提的是文章在论文当中清晰的将Independent Learning 、Centralized Critic 、Value Decomposition这三种算法框架进行绘图，有利于学者清楚的了解不同算法框架的架构，从而进行改进和学习。

Benchmark比较

作者将Gym、pymarl、MARLlib的数据流模型进行了绘制，清楚的描述了不同的库和环境交互过程当中数据流的变化，具体如下所示：

代码框架

作者清晰的展示了自己代码的框架结构图，对于不同场景的切换、算法的调用、模型的更改以及GPU和CPU的调用进行了清晰的展示。

MARLlib代码及说明

MARLlib 的代码说明地址如下所示，https://marllib.readthedocs.io/en/latest/resources/awesome.html

作者在该网站自己的讲述了各类环境的安装，算法的推导以及之间的关系，还有清晰的算法框架和分类，这些资源都有助于研究者进一步进行学习并开发。例如IA2C的算法。

对于MARLlib的介绍就到这里，希望呢能够帮到各位研究学者，如果有其他比较容易上手的Benchmark，欢迎大家在下方留言。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。