
MA
Coop_Multi-Agent_DRL
The whole world can be modeled as multi-agent
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ma_rl_新思想
这个解耦的方法很有意思!我们icml 2020也做了个类似的工作,我们的想法是让agent自己去学会不一样的sub-task,然后这些sub-task越diverse它们的解耦性就越好,然后qmix, qtran, vdn这样的基于网络结构的假设就可以去除了。论文链接...转载 2020-11-11 12:56:56 · 187 阅读 · 0 评论 -
混合动作空间(Dis_Conti_Hybrid)
混合动作空间参考文献 与离散动作空间或连续动作空间不同,拥有混合动作空间的智能体在每一步执行动作时都需要选择一个离散动作以及该离散动作对应的一个或多个连续性动作参数的值, 举个例子, 比如在实际应用场景机器人足球世界杯中,一个足球机器人可以选择带球(离散)到某个位置(连续坐标)或者用力(连续)将球踢(离散)到某个位置等混合动作;在一些大型游戏中,玩家控制的每个角色在选择释放哪个技能(离散)后...原创 2019-11-05 08:16:59 · 1729 阅读 · 2 评论 -
MADDPG
文章目录1 DDPG1 DDPG原创 2019-10-28 20:49:48 · 3818 阅读 · 3 评论