65、多智能体决策中的合作博弈理论

多智能体决策中的合作博弈理论

在多智能体决策场景中,合作博弈是一种重要的决策模式。在合作博弈里,智能体之间能够达成具有约束力的合作协议,从而获得比单独行动更多的价值。

1. 合作博弈模型

合作博弈的一种形式是“特征函数形式的可转移效用合作博弈”。在这个模型中,当一组智能体合作时,整个团队会获得一定的效用值,这个值可以在团队成员之间进行分配。该模型用公式 $G = (N,ν)$ 来定义,其中 $N = {1,…,n}$ 是玩家集合,$ν$ 是特征函数,它为玩家集合 $N$ 的每个子集 $C$ 给出了这些玩家合作时能获得的价值。通常假设空集玩家获得的价值为 $0$(即 $ν({}) = 0$),并且特征函数是非负的($ν(C) ≥0$ 对所有 $C$ 成立)。在某些游戏中,还会假设玩家单独工作时获得的价值为 $0$,即 $ν({i}) = 0$ 对所有 $i ∈N$ 成立。

2. 联盟结构和结果
  • 联盟和联盟结构 :玩家的子集 $C$ 被称为联盟,所有玩家的集合 $N$ 被称为大联盟。在模型中,每个玩家必须恰好加入一个联盟,这些联盟构成了玩家集合的一个划分,称为联盟结构。形式上,玩家集合 $N$ 上的联盟结构是一组联盟 ${C_1,…,C_k}$,满足以下条件:
    • $C_i \neq {}$
    • $C_i \subseteq N$
    • $C_i \cap C_j = {}$ 对所有 $i \neq j ∈N$ 成立
    • $C_1 \cup···\cup C_k = N$
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值