不完美信息扩展式博弈:概念、策略与均衡计算
1. 不完美信息扩展式博弈的定义
在之前对扩展式博弈的讨论中,我们假设玩家能明确知晓自己所处的选择节点,即玩家拥有完全信息,这类博弈被称为完美信息博弈。然而,在许多实际情况中,玩家可能仅掌握部分信息,甚至对其他玩家的行动一无所知,或者对自己过去的行动记忆有限。不完美信息扩展式博弈正是为解决这一问题而提出的。
不完美信息博弈是一种扩展式博弈,其中每个玩家的选择节点被划分为信息集。直观地说,如果两个选择节点位于同一个信息集,那么玩家无法区分它们。一个不完美信息博弈可以用元组 $(N, A, H, Z, χ, ρ, σ, u, I)$ 来表示,其中 $(N, A, H, Z, χ, ρ, σ, u)$ 是一个完美信息扩展式博弈,而 $I = (I_1, \ldots, I_n)$ 是对玩家选择节点的划分。
例如,在图 5.10 所示的不完美信息扩展式博弈中,玩家 1 有两个信息集:包含顶部选择节点的集合和包含底部选择节点的集合。在第二个信息集中,两个底部选择节点具有相同的可能行动集。这意味着玩家 1 在做出 $\ell$ 和 $r$ 之间的选择时,不知道玩家 2 选择了 $A$ 还是 $B$。
2. 策略与均衡
在不完美信息博弈中,纯策略是指玩家在每个信息集中选择一个可用的行动。对于玩家 $i$,其纯策略由笛卡尔积 $\prod_{I_{i,j} \in I_i} \chi(I_{i,j})$ 组成。
完美信息博弈可以看作是不完美信息博弈的一种特殊情况,其中每个划分的等价类都是单元素集。以囚徒困境博弈为例,它可以很容易地转换为一个不完美信息扩展式博弈(如图 5.11 所示)。这表
超级会员免费看
订阅专栏 解锁全文
47

被折叠的 条评论
为什么被折叠?



