很认真的中了一篇AAMAS2019的文章：Modelling the Dynamic Joint Policy of Teammates with Attention Multi-agent DDPG

最新推荐文章于 2024-09-28 22:35:17 发布

原创最新推荐文章于 2024-09-28 22:35:17 发布 · 5.1k 阅读

·

7

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

（深度）增强学习专栏收录该内容

40 篇文章

订阅专栏

本文介绍了一种利用深度强化学习实现多智能体合作的方法，通过引入基于agent modelling的attention机制，确保了理论依据的严谨性。该研究在实验上取得了显著成果，获得评审团高度评价。

部署运行你感兴趣的模型镜像

【有中相同会议的小伙伴记得联系我哦，可以一起商量着把会议相关的事情做好】

这篇文章是利用深度强化学习（Deep Reinforcement Learning）做多智能体合作（multi-agent cooperation）。

主要贡献点在于使用了一个attention机制 in a principled way，principle在，这个attention是基于agent modelling方法推导得出的，因此具有理论依据。

同时实验结果也很好。

具体内容参考：https://arxiv.org/abs/1811.07029

评委们的分数给的还算比价高：6/7/8。

The review process was extremely selective. Out of a total of 781 reviewed submissions, the program committee selected 189 full papers (8 pages plus references) for oral presentation and 218 extended abstracts (2 pages plus references) for poster presentation.

您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调

LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。