贝叶斯通信如何导向信念中的纳什均衡
1. 引言
在博弈论场景中,混合策略纳什均衡的概念至关重要,但玩家如何学习以达成该均衡的过程却鲜为人知。本文聚焦于贝叶斯学习过程,探讨其如何引导有限战略形式博弈达到混合策略纳什均衡。
传统上,R.J. Aumann和A. Brandenburger给出了混合策略纳什均衡的认知条件,指出具有分区信息的玩家预测的共同知识能产生博弈的纳什均衡,但未明确学习过程。本文旨在从认知角度填补这一空白。
主要定理表明:假设战略形式博弈中的玩家具有带共同先验分布的p - 信念系统,在根据协议进行的通信过程中,玩家对其他玩家行动信念的修正,使他们未来预测的分布在长期内诱导出博弈的混合策略纳什均衡。
2. 模型
- 状态空间与玩家 :设Ω为非空有限集,称为状态空间;N为有限玩家集,至少有两个玩家(n ≥ 2);2Ω为Ω的所有子集的集合,其中每个成员称为事件,Ω的每个元素称为状态。μ是Ω上的概率测度,对所有玩家是共同的,且(Ω, μ)是具有全支撑的有限概率空间。
- p - 信念系统 :设p是满足0 < p ≤ 1的实数。与分区信息结构(Πi)i∈N相关联的p - 信念系统是元组⟨N, Ω, μ, (Πi)i∈N, (Bi(∗, p))i∈N⟩。其中,i的p - 信念算子Bi(∗; p)是2Ω上的算子,Bi(E, p)是Ω中i以至少p的概率相信事件E发生的状态集合,即Bi(E; p) := {ω ∈ Ω | μ(E | Πi(ω)) ≥ p }。当p = 1时,1 - 信念算子Bi(∗; 1)成为知识算子。
超级会员免费看
订阅专栏 解锁全文
1190

被折叠的 条评论
为什么被折叠?



