68、多智能体系统的博弈论基础

多智能体系统的博弈论基础

1. 引言

多智能体系统大致可分为两类:合作系统和非合作系统。在合作系统中,所有智能体共享一个共同目标,并为实现该目标而充分合作,这种情况通常出现在所有智能体由单一所有者控制时,比如多机器人探索或搜索救援任务。而在非合作系统中,每个智能体都有自己的欲望和偏好,这些可能与其他智能体的相冲突,例如在电子商务环境中,智能体代表电子市场中的不同参与者,所有参与者都试图最大化自己的效用。

即使是合作智能体,确保多智能体系统的顺利运行也并非易事,这受到多种因素的影响,从不可靠的通信渠道到计算限制等。引入非合作智能体则进一步增加了问题的复杂性,因为需要激励智能体选择理想的行动方案。博弈论作为数学经济学的一个分支,恰好可以为分析由自利智能体组成的多智能体系统提供理论基础,它对有偏好的实体的行为进行建模和分析。

接下来,我们将简要介绍博弈论的基础,包括基本概念的正式定义,并通过直观的例子说明其应用。我们先从正常形式的博弈开始讨论,即所有玩家对彼此的偏好有完全信息,并同时选择行动的博弈。

2. 正常形式的博弈

在博弈论中,博弈是多个自利智能体之间的交互。对于所有参与者了解彼此喜好并同时选择行动的博弈,需要明确以下几个组成部分:
- 智能体集合 :参与博弈的智能体或玩家集合。
- 行动集合 :每个智能体可选择的行动或策略集合,选定的行动向量称为行动配置文件。
- 可能结果集合 :集体行动的结果,目前假设结果是确定性的,由所有智能体选择的行动唯一确定。
- 支付函数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值