多智能体决策中的合作博弈理论
在多智能体决策场景中,合作博弈是一种重要的决策模式。在合作博弈里,智能体之间能够达成具有约束力的合作协议,从而获得比单独行动更多的价值。
1. 合作博弈模型
合作博弈的一种形式是“特征函数形式的可转移效用合作博弈”。在这个模型中,当一组智能体合作时,整个团队会获得一定的效用值,这个值可以在团队成员之间进行分配。该模型用公式 $G = (N,ν)$ 来定义,其中 $N = {1,…,n}$ 是玩家集合,$ν$ 是特征函数,它为玩家集合 $N$ 的每个子集 $C$ 给出了这些玩家合作时能获得的价值。通常假设空集玩家获得的价值为 $0$(即 $ν({}) = 0$),并且特征函数是非负的($ν(C) ≥0$ 对所有 $C$ 成立)。在某些游戏中,还会假设玩家单独工作时获得的价值为 $0$,即 $ν({i}) = 0$ 对所有 $i ∈N$ 成立。
2. 联盟结构和结果
- 联盟和联盟结构 :玩家的子集 $C$ 被称为联盟,所有玩家的集合 $N$ 被称为大联盟。在模型中,每个玩家必须恰好加入一个联盟,这些联盟构成了玩家集合的一个划分,称为联盟结构。形式上,玩家集合 $N$ 上的联盟结构是一组联盟 ${C_1,…,C_k}$,满足以下条件:
- $C_i \neq {}$
- $C_i \subseteq N$
- $C_i \cap C_j = {}$ 对所有 $i \neq j ∈N$ 成立
- $C_1 \cup···\cup C_k = N$
超级会员免费看
订阅专栏 解锁全文
2082

被折叠的 条评论
为什么被折叠?



