多智能体系统的博弈论基础
1. 引言
多智能体系统大致可分为两类:合作系统和非合作系统。在合作系统中,所有智能体共享一个共同目标,并为实现该目标而充分合作,这种情况通常出现在所有智能体由单一所有者控制时,比如多机器人探索或搜索救援任务。而在非合作系统中,每个智能体都有自己的欲望和偏好,这些可能与其他智能体的相冲突,例如在电子商务环境中,智能体代表电子市场中的不同参与者,所有参与者都试图最大化自己的效用。
即使是合作智能体,确保多智能体系统的顺利运行也并非易事,这受到多种因素的影响,从不可靠的通信渠道到计算限制等。引入非合作智能体则进一步增加了问题的复杂性,因为需要激励智能体选择理想的行动方案。博弈论作为数学经济学的一个分支,恰好可以为分析由自利智能体组成的多智能体系统提供理论基础,它对有偏好的实体的行为进行建模和分析。
接下来,我们将简要介绍博弈论的基础,包括基本概念的正式定义,并通过直观的例子说明其应用。我们先从正常形式的博弈开始讨论,即所有玩家对彼此的偏好有完全信息,并同时选择行动的博弈。
2. 正常形式的博弈
在博弈论中,博弈是多个自利智能体之间的交互。对于所有参与者了解彼此喜好并同时选择行动的博弈,需要明确以下几个组成部分:
- 智能体集合 :参与博弈的智能体或玩家集合。
- 行动集合 :每个智能体可选择的行动或策略集合,选定的行动向量称为行动配置文件。
- 可能结果集合 :集体行动的结果,目前假设结果是确定性的,由所有智能体选择的行动唯一确定。
- 支付函数
超级会员免费看
订阅专栏 解锁全文
2063

被折叠的 条评论
为什么被折叠?



