利用扩展形式结构进行实证博弈论分析
1. 博弈场景与实证博弈论分析(EGTA)概述
在一些博弈场景中,玩家 1 有 10 个行动选择 ${\pi_i^1} {i = 1}^{10}$,之后会发生一个随机事件 $X(\pi_i^1) \in {A, B}$,结果 A 出现的概率 $P(A | \pi_i^1)$ 依赖于玩家 1 的选择 $\pi_i^1$。玩家 2 能观察到结果 $e \in {A, B}$,但不知道玩家 1 的具体行动,这使得玩家 2 有两个信息集。玩家 2 在每个信息集里也有 10 个行动可供选择,分别为 $\Pi {2A} = {\pi_i^{2A}} {i = 1}^{10}$ 和 $\Pi {2B} = {\pi_i^{2B}} {i = 1}^{10}$。每个具有历史 $( \pi_i^1, e, \pi {i’}^{2e})$ 的叶节点都标有玩家 1 和玩家 2 实现的二维效用向量。不过,条件概率 $P(A | \pi_i^1)$ 和叶节点效用 $u( \pi_i^1, e, \pi_{i’}^{2e})$ 对于博弈分析师来说并非先验已知。
实证博弈论分析(EGTA)框架是为了将博弈论推理应用于那些过于复杂而无法进行解析描述的场景而开发的,这些场景只能通过程序模拟来访问。多年来,EGTA 已被应用于多个问题领域,包括休闲策略游戏、安全博弈、社会困境和拍卖等。同时,在方法学问题上也有大量工作,例如如何决定模拟哪些策略配置,以及如何对估计的博弈模型进行统计推理。近年来,由于基于模拟的方法与深度强化学习(RL)中的强大新策略生成方法相契合,EGTA 受到了新的关注。
EGTA 的主要特点是根据
超级会员免费看
订阅专栏 解锁全文
41

被折叠的 条评论
为什么被折叠?



