博弈论中的特殊均衡与游戏类型解析
1. 贝叶斯 - 纳什均衡
1.1 最佳响应集合
最佳响应集合 (BR_i) 是一个集合,因为对于参与者 (i) 而言,可能存在多种策略能产生相同的期望效用。虽然 (BR) 是基于参与者 (i) 的事前期望效用计算的,乍看有些奇怪,但将 (EUi(s)) 写成 (\sum_{\theta_i\in\Theta_i} p(\theta_i)EUi(s, \theta_i)) 后会发现,(EUi(s’ i, s {-i}, \theta_i)) 并不依赖于当参与者 (i) 类型不是 (\theta_i) 时所采用的策略。实际上,这是对参与者 (i) 在每种可能类型下的事中期望效用进行独立最大化。直观来讲,如果在收到信号后某个行动是最优的,那么它也是事前针对该信号制定的最优条件计划。
1.2 贝叶斯 - 纳什均衡定义
贝叶斯 - 纳什均衡是一个混合策略组合 (s),满足 (\forall i, s_i \in BR_i(s_{-i}))。这与纳什均衡的定义类似,即每个参与者针对其他参与者的策略做出最佳响应。不同之处在于,贝叶斯 - 纳什均衡的定义是建立在贝叶斯博弈的最佳响应和期望效用定义之上的。若参与者的策略不是针对每种可能类型都有定义,就无法以这种方式定义均衡。因为参与者 (i) 要对其他参与者 (-i) 做出最佳响应,就必须知道每个参与者在其每种可能类型下会采用的策略,否则就无法评估公式 (EUi(s’ i, s {-i}))。
1.3 计算均衡
尽管贝叶斯 - 纳什均衡与纳什均衡相似,但概念上可能更复杂。不过,如同扩展式博弈一样,可
超级会员免费看
订阅专栏 解锁全文
56

被折叠的 条评论
为什么被折叠?



