多智能体博弈策略计算方法
1. 相关概念及算法概述
在多智能体博弈中,为了让智能体做出最优决策,需要计算各种均衡策略。虽然线性规划可以在多项式时间内求解,但联合行动空间的大小会随着智能体数量的增加呈指数级增长。不过,通过设置约束条件可以实现相关均衡,并且可以使用不同的目标函数来选择不同的有效相关均衡。以下是几种常见的目标函数:
| 名称 | 描述 | 目标函数 |
| — | — | — |
| 功利主义 | 最大化净效用 | $\text{maximize} {\pi} \sum {i} \sum_{a} R_{i}(a)\pi(a)$ |
| 平等主义 | 最大化所有智能体效用的最小值 | $\text{maximize} {\pi} \text{minimize} {i} \sum_{a} R_{i}(a)\pi(a)$ |
| 富豪主义 | 最大化所有智能体效用的最大值 | $\text{maximize} {\pi} \text{maximize} {i} \sum_{a} R_{i}(a)\pi(a)$ |
| 独裁主义 | 最大化智能体 $i$ 的效用 | $\text{maximize} {\pi} \sum {a} R_{i}(a)\pi(a)$ |
以下是计算相关均衡的代码实现:
struct CorrelatedEquilibrium end
function solve(M::CorrelatedEquilibrium, 𝒫::SimpleGame)
超级会员免费看
订阅专栏 解锁全文
2080

被折叠的 条评论
为什么被折叠?



