46、基于支持枚举法计算行动图游戏的纳什均衡

基于支持枚举法计算行动图游戏的纳什均衡

1. 引言

在博弈论中,同时行动、完全信息博弈的经典表示形式是标准型。然而,由于这种表示形式的规模会随着玩家数量的增加呈指数级增长,因此对于涉及多个玩家的交互建模来说并不实用。为了解决这个问题,人们提出了许多紧凑表示有趣博弈的方法。行动图游戏(AGGs)统一了以往的表示方法,并且能够在多项式空间内表示许多其他类型的博弈。

计算紧凑表示博弈的解概念(如纳什均衡)是一个活跃的研究领域。目前,一种有效的方法是对现有的基于标准型的算法进行修改,使其能够高效地处理紧凑表示。支持枚举法(SEM)在标准型博弈中表现出了出色的实证性能,但尚未被扩展到紧凑表示的博弈中。本文将介绍如何将SEM扩展到AGGs表示中,从而在最坏情况下的运行时间上实现指数级的改进。

2. 技术背景
2.1 行动图游戏

行动图游戏通过利用收益中的几种结构来实现紧凑表示。
- 匿名性 :一个代理的收益仅取决于他自己的行动和其他代理所诱导的“配置”,即每个行动的代理数量的元组。这意味着代理的收益不依赖于哪个代理采取了哪个行动,从而减少了表示的开销。
- 上下文特定独立性 :一个给定的代理只关心其他代理采取特定子集行动的情况。这种独立性通过行动图来编码,行动图是一个有向图,其中每个节点对应一个行动,并且一个行动的收益仅取决于其相邻节点的计数。

形式上,一个行动图游戏是一个四元组 $(N, A, G, u)$,其中:
- $N$ 是代理的集合 $(1, 2, …, n)$;
- $A = \Pi_{i\in N

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值