19、博弈论中的特殊均衡与游戏类型解析

博弈论中的特殊均衡与游戏类型解析

1. 贝叶斯 - 纳什均衡

1.1 最佳响应集合

最佳响应集合 (BR_i) 是一个集合,因为对于参与者 (i) 而言,可能存在多种策略能产生相同的期望效用。虽然 (BR) 是基于参与者 (i) 的事前期望效用计算的,乍看有些奇怪,但将 (EUi(s)) 写成 (\sum_{\theta_i\in\Theta_i} p(\theta_i)EUi(s, \theta_i)) 后会发现,(EUi(s’ i, s {-i}, \theta_i)) 并不依赖于当参与者 (i) 类型不是 (\theta_i) 时所采用的策略。实际上,这是对参与者 (i) 在每种可能类型下的事中期望效用进行独立最大化。直观来讲,如果在收到信号后某个行动是最优的,那么它也是事前针对该信号制定的最优条件计划。

1.2 贝叶斯 - 纳什均衡定义

贝叶斯 - 纳什均衡是一个混合策略组合 (s),满足 (\forall i, s_i \in BR_i(s_{-i}))。这与纳什均衡的定义类似,即每个参与者针对其他参与者的策略做出最佳响应。不同之处在于,贝叶斯 - 纳什均衡的定义是建立在贝叶斯博弈的最佳响应和期望效用定义之上的。若参与者的策略不是针对每种可能类型都有定义,就无法以这种方式定义均衡。因为参与者 (i) 要对其他参与者 (-i) 做出最佳响应,就必须知道每个参与者在其每种可能类型下会采用的策略,否则就无法评估公式 (EUi(s’ i, s {-i}))。

1.3 计算均衡

尽管贝叶斯 - 纳什均衡与纳什均衡相似,但概念上可能更复杂。不过,如同扩展式博弈一样,可

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值