很认真的中了一篇AAMAS2019的文章:Modelling the Dynamic Joint Policy of Teammates with Attention Multi-agent DDPG

【有中相同会议的小伙伴记得联系我哦,可以一起商量着把会议相关的事情做好】

这篇文章是利用深度强化学习(Deep Reinforcement Learning)做多智能体合作(multi-agent cooperation)。

主要贡献点在于使用了一个attention机制 in a principled way,principle在,这个attention是基于agent modelling方法推导得出的,因此具有理论依据。

同时实验结果也很好。

具体内容参考:https://arxiv.org/abs/1811.07029

 

评委们的分数给的还算比价高:6/7/8。

The review process was extremely selective. Out of a total of 781 reviewed submissions, the program committee selected 189 full papers (8 pages plus references) for oral presentation and 218 extended abstracts (2 pages plus references) for poster presentation.

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值