30、紧凑博弈中最优相关均衡计算的通用框架

紧凑博弈中最优相关均衡计算的通用框架

1. 引言

在博弈论中,计算有限博弈的解概念是一类基础的计算问题。近年来,大量研究集中在计算样本纳什均衡上。而相关均衡(CE)作为另一个重要的解概念,由奥曼于1974年和1987年首次提出。在混合策略纳什均衡中,玩家独立随机化行动;而在相关均衡里,玩家可以根据中间人的信号来协调他们的行为。

相关均衡可以表示为满足某些线性约束的纯策略组合上的概率分布。由此产生的线性可行性程序的规模与博弈的标准形式表示的规模呈多项式关系。然而,标准形式表示的规模会随着玩家数量的增加呈指数级增长,这在处理涉及大量玩家的博弈时会成为问题。幸运的是,大多数实际中的大型博弈具有高度结构化的收益函数,因此可以进行紧凑表示。相关研究致力于寻找能够简洁描述结构化博弈的紧凑博弈表示方法,如图形博弈和动作图博弈。但此时,用于计算相关均衡的线性可行性程序的规模可能会随着紧凑表示的规模呈指数级增长,并且相关均衡的指定可能需要指数级的空间。

计算样本相关均衡的问题最近被证明对于大多数现有的紧凑表示可以在多项式时间内解决。然而,由于一个博弈中通常可能存在无限多个相关均衡,找到任意一个相关均衡的价值有限。因此,我们关注的是计算优化某些目标的相关均衡,特别是优化玩家期望效用的线性函数,例如计算最大(或最小)社会福利。我们还对计算最优粗相关均衡(CCE)感兴趣。已知任何无外部遗憾学习动态的经验分布会收敛到粗相关均衡集合,而无内部遗憾学习动态的经验分布会收敛到相关均衡集合。因此,最优相关均衡和最优粗相关均衡为这些动态的经验分布的社会福利提供了有用的界限。

我们特别关注最优相关均衡/最优粗相关均衡问题与计算博弈的最优社会福利结果(即策略组合)问题之间的关系。这是算法博弈论社区非

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值