多智能体系统的博弈论基础
1. 引言
多智能体系统大致可分为两类:合作系统和非合作系统。在合作系统中,所有智能体共享一个共同目标,并为实现该目标而充分合作,例如多机器人探索或搜索救援任务,所有智能体可能由单一所有者控制。而在非合作系统中,每个智能体都有自己的愿望和偏好,这些愿望和偏好可能与其他智能体的相冲突,比如电子商务环境中,智能体代表电子市场中的不同参与者,所有参与者都试图最大化自己的效用。
即使是合作智能体,确保多智能体系统的顺利运行也并非易事,这受到多种因素的影响,从不可靠的通信渠道到计算限制等。而引入非合作智能体则使问题的复杂性进一步增加,因为需要激励智能体选择理想的行动方案。博弈论作为数学经济学的一个分支,恰好可以为分析由自利智能体组成的多智能体系统提供理论基础,它对那些对可能结果有偏好并需选择行动以实现这些结果的实体的行为进行建模和分析。
本文将简要概述博弈论的基础,提供博弈论基本概念的正式定义,并通过直观的例子说明其应用。
2. 正规形式博弈
在博弈论中,博弈是多个自利智能体之间的交互。我们首先关注所有参与者了解彼此的喜好,并同时选择行动的博弈。描述这样的博弈需要指定以下组件:
- 参与博弈的智能体或玩家集合。
- 每个智能体可用的行动或策略集合,我们将每个智能体选择的行动向量称为行动配置文件。
- 可能的结果集合,即集体行动的结果,目前假设结果是确定性的,由所有智能体选择的行动唯一确定。
- 每个智能体的收益函数,为每个结果分配一个数值(该智能体的“幸福度”)。
我们主要考虑有限数量玩家的博弈,不假设玩家的行动集合是有限的。所有智能体同时从各自可用的行动集合中
超级会员免费看
订阅专栏 解锁全文
2064

被折叠的 条评论
为什么被折叠?



