最新最全论文合集——多智能体强化学习模型

原创于 2021-05-19 19:23:30 发布 · 679 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

AMiner 同时被 3 个专栏收录

736 篇文章

订阅专栏

AMiner论文推荐

526 篇文章

订阅专栏

417 篇文章

订阅专栏

AMiner平台（https://www.aminer.cn）由清华大学计算机系研发，拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱，提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线，吸引了全球220个国家/地区1000多万独立IP访问，数据下载量230万次，年度访问量超过1100万，成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

必读论文：https://www.aminer.cn/topic

论文集地址：https://www.aminer.cn/topic/60a461d292c7f9be21c5f4ec

近年来，随着强化学习在多个应用领域取得了令人瞩目的成果，并且考虑到在现实场景中通常会同时存在多个决策个体（智能体），部分研究者逐渐将眼光从单智能体领域延伸到多智能体，即多智能体强化学习（multi-agent reinforcement learning）。当同时存在多个智能体与环境交互时，整个系统就变成一个多智能体系统。每个智能体仍然是遵循着强化学习的目标，也就是是最大化能够获得的累积回报，而此时环境全局状态的改变就和所有智能体的联合动作相关了。因此在智能体策略学习的过程中，需要考虑联合动作的影响。本论文集包含多智能体强化学习模型论文。

该论文集共收录12篇论文，引用最多的论文为Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments，引用数为1151。

在这里插入图片描述

下论文，到AMiner：https://www.aminer.cn

#AMiner# #论文#

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。