基于支持枚举法计算行动图游戏的纳什均衡
1. 引言
在博弈论中,同时行动、完全信息博弈的经典表示形式是标准型。然而,由于这种表示形式的规模会随着玩家数量的增加呈指数级增长,因此对于涉及多个玩家的交互建模来说并不实用。为了解决这个问题,人们提出了许多紧凑表示有趣博弈的方法。行动图游戏(AGGs)统一了以往的表示方法,并且能够在多项式空间内表示许多其他类型的博弈。
计算紧凑表示博弈的解概念(如纳什均衡)是一个活跃的研究领域。目前,一种有效的方法是对现有的基于标准型的算法进行修改,使其能够高效地处理紧凑表示。支持枚举法(SEM)在标准型博弈中表现出了出色的实证性能,但尚未被扩展到紧凑表示的博弈中。本文将介绍如何将SEM扩展到AGGs表示中,从而在最坏情况下的运行时间上实现指数级的改进。
2. 技术背景
2.1 行动图游戏
行动图游戏通过利用收益中的几种结构来实现紧凑表示。
- 匿名性 :一个代理的收益仅取决于他自己的行动和其他代理所诱导的“配置”,即每个行动的代理数量的元组。这意味着代理的收益不依赖于哪个代理采取了哪个行动,从而减少了表示的开销。
- 上下文特定独立性 :一个给定的代理只关心其他代理采取特定子集行动的情况。这种独立性通过行动图来编码,行动图是一个有向图,其中每个节点对应一个行动,并且一个行动的收益仅取决于其相邻节点的计数。
形式上,一个行动图游戏是一个四元组 $(N, A, G, u)$,其中:
- $N$ 是代理的集合 $(1, 2, …, n)$;
- $A = \Pi_{i\in N
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



