16、利用扩展形式结构进行实证博弈论分析

最新推荐文章于 2025-09-15 13:06:28 发布

寂静夜空35

最新推荐文章于 2025-09-15 13:06:28 发布

阅读量42

点赞数

CC 4.0 BY-SA版权

分类专栏： WINE 2022会议精华文章标签：实证博弈论分析 EGTA 扩展形式博弈

本文链接：https://blog.youkuaiyun.com/vulkan6gpu/article/details/151011688

WINE 2022会议精华专栏收录该内容

43 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

利用扩展形式结构进行实证博弈论分析

1. 博弈场景与实证博弈论分析（EGTA）概述

在一些博弈场景中，玩家 1 有 10 个行动选择 ${\pi_i^1} {i = 1}^{10}$，之后会发生一个随机事件 $X(\pi_i^1) \in {A, B}$，结果 A 出现的概率 $P(A | \pi_i^1)$ 依赖于玩家 1 的选择 $\pi_i^1$。玩家 2 能观察到结果 $e \in {A, B}$，但不知道玩家 1 的具体行动，这使得玩家 2 有两个信息集。玩家 2 在每个信息集里也有 10 个行动可供选择，分别为 $\Pi {2A} = {\pi_i^{2A}} {i = 1}^{10}$ 和 $\Pi {2B} = {\pi_i^{2B}} {i = 1}^{10}$。每个具有历史 $( \pi_i^1, e, \pi {i’}^{2e})$ 的叶节点都标有玩家 1 和玩家 2 实现的二维效用向量。不过，条件概率 $P(A | \pi_i^1)$ 和叶节点效用 $u( \pi_i^1, e, \pi_{i’}^{2e})$ 对于博弈分析师来说并非先验已知。

实证博弈论分析（EGTA）框架是为了将博弈论推理应用于那些过于复杂而无法进行解析描述的场景而开发的，这些场景只能通过程序模拟来访问。多年来，EGTA 已被应用于多个问题领域，包括休闲策略游戏、安全博弈、社会困境和拍卖等。同时，在方法学问题上也有大量工作，例如如何决定模拟哪些策略配置，以及如何对估计的博弈模型进行统计推理。近年来，由于基于模拟的方法与深度强化学习（RL）中的强大新策略生成方法相契合，EGTA 受到了新的关注。

EGTA 的主要特点是根据