博弈论中的扩展式博弈与均衡计算
1. 纳什均衡计算的历史与资源
在博弈论中,寻找样本纳什均衡的复杂度是众多研究的焦点。早期,TFNP 类的原始定义被提出,它是 PPAD 的超类,随后 PPAD 类也被定义。后续研究表明,寻找任意固定数量玩家游戏的均衡并不比寻找四人游戏的均衡更难,且这些计算问题是 PPAD 完全的,甚至很快将结果扩展到两人游戏。对于具有特定属性的纳什均衡,有相关的 NP 完全性结果和不可近似性结果。
经典的计算两人游戏纳什均衡的算法有很多,例如 Lemke - Howson 算法,它可看作是 Lemke 解决线性互补问题的枢轴程序的特例;Scarf 的基于单纯形细分的算法;基于同伦的近似方法等。
此外,还有两个重要的在线资源:
- GAMBIT:一个用于有限正规形式和扩展形式游戏的博弈论算法库,包含多种寻找纳什均衡的算法,适用于一般和、n 玩家游戏,以及两人游戏、零和游戏等特殊情况。其网址为 http://econweb.tamu.edu/gambit 。
- GAMUT:一套用于测试博弈论算法的游戏生成器。其网址为 http://gamut.stanford.edu 。
2. 扩展式博弈概述
以往我们常假设游戏以正规形式表示,即类似一个大表格。正规形式概念简单,被认为是基础的,且所有有限游戏都有对应的“诱导正规形式”,从这个意义上说,正规形式表示具有普遍性。
而扩展式博弈是一种有限表示,它不总是假设玩家同时行动。这种表示通常比其诱导正规形式指数级更小,且更便于推理。虽然扩展式博弈的纳什均衡可通过其诱导正规形式找到,但直接处理扩展形式能带来计算上的好处。此外,还有一些解决方案概念,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



