
多智能体强化学习MARL
文章平均质量分 71
azeyeazeye
这个作者很懒,什么都没留下…
展开
-
Multi-agent Particle Environment - MPE多智能体强化学习运行环境的任务简介
MPE环境是一个时间离散、空间连续的二维环境,UI的界面风格如图所示,它通过控制在二维空间中代表不同含义的粒子,实现对于各类MARL算法的验证。MPE被人们广泛所知是借助于那篇NiPS2017的著名多智能体强化学习算法MADDPG的实验环境,可以直接在arxiv中搜索到。MPE的使用方法与gym的使用方法基本一致,即每一个step通过输入agent的动作状态等信息来换取MPE的环境感知。MPE和gym一样,也是由openai组织进行开发的,其主要有以下几个任务构成。——————————————转载 2021-06-30 19:28:35 · 3070 阅读 · 3 评论 -
MADDPG:Multi-Agent Actor-Critic for Mixed Cooperative & MPE:Multi-Agent Particle Environment
MAPPO论文代码1.研究动机是什么2.主要解决了什么问题3.所提方法是什么MAPPO算法细节提升PPO性能的5个关键4.关键结果及结论是什么主要结论MPE实验SMAC实验Hanabi实验消融实验值归一化Agent-Specific Global StateTraining Data UsageAction MaskingDeath Masking5.创新点在哪里6.有值得阅读的相关文献吗7.综合评价又如何新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代原创 2021-03-17 15:24:13 · 652 阅读 · 0 评论 -
MAPPO:The Surprising Effectiveness of MAPPO in Cooperative, Multi-Agent Games
MAPPO1.研究动机是什么2.主要解决了什么问题3.所提方法是什么4.关键结果及结论是什么5.创新点在哪里6.有值得阅读的相关文献吗7.综合评价又如何新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入参考链接[Paper|原创 2021-03-16 20:37:38 · 8971 阅读 · 22 评论 -
多智能体强化学习资料MARL
多智能体强化学习资料MARL框架https://github.com/oxwhirl/pymarlhttps://github.com/starry-sky6688/StarCrafthttps://github.com/openai/multiagent-particle-envs环境算法https://github.com/LantaoYu/MARL-Papershttps://www.bilibili.com/video/BV18z411q7Kchttps://www.youtube原创 2021-03-12 21:48:12 · 482 阅读 · 4 评论