博弈论中的标准型与扩展型游戏解析
1. 标准型博弈(Normal - Form Games)
标准型博弈是表示玩家互动和策略空间的最基本游戏形式。它通过矩阵(对于两个以上玩家则是多个矩阵)捕捉玩家所有可能的行动或策略组合及其对应的收益。玩家可以选择纯策略(确定性地选择单一策略)或混合策略(指定纯策略上的概率分布),目标是最大化预期效用。
一个有限的 N 人标准型博弈由元组 (, , u) 描述:
- = {1, …, N} 是 N 个玩家的有限集合,由 i 索引。
- = 1 × · · · × N 是玩家的联合行动集合,其中 i 是玩家 i 可用的有限行动集合。a = (a1, …, aN) ∈ 称为行动配置文件,其中 ai ∈ i。
- u = (u1, …, uN),其中 ui ∶ → ℝ 是玩家 i 的效用(或收益)函数,它将行动配置文件 a 映射到一个实值。玩家 i 的效用不仅取决于自己的行动 ai,还取决于其他玩家的行动。
玩家可以选择混合策略,用 Si = Δ|i| 表示玩家 i 的混合策略集合,它是维度为 |i| 的概率单纯形。S = S1 × · · · × SN 是联合策略集合,s = (s1, …, sN) ∈ S 称为策略配置文件。混合策略的支持集定义为以非零概率选择的行动集合。行动可以表示为支持大小为 1 的概率分布(一维为 1,其他维度为 0)。效用函数可以通过预期效用扩展到混合策略,即 ui(s) = ∑a∈ ui(a) ∏n i′=1 si′(ai′)。如果所有玩家的效用总和始终为零,则游戏是零和游戏;否则是非零和或一般和游戏。
许多经典游戏可以用标准型表示,例如囚
超级会员免费看
订阅专栏 解锁全文
42

被折叠的 条评论
为什么被折叠?



