博弈论、验证与控制器综合的研究进展
1 博弈论与验证中的纳什均衡
1.1 策略应用与公式满足性
在博弈论中,我们将某个结果应用到从初始状态 (v_{init}) 开始的每个博弈 (G[A]) 中。对于玩家 (A) 在 (G[A]) 中的对应强最优策略,我们记为 (\sigma_A)。我们来论证策略组合 (\sigma = (\sigma_A) {A \in P}) 的主要结果 (\rho) 为何满足公式 (\varPhi {NE})。假设 (\rho \not\models \varphi_A),通过反证法,假设沿着 (\rho) 路径上的某个访问顶点 (v)(在某个前缀 (\pi) 之后)不属于 (W_{[-A]})。根据证明开头提到的强确定性结果,这意味着顶点 (v) 属于 (W_A)。由于 (\sigma_A) 是强最优策略,在经过前缀 (\pi) 之后它仍然是最优的,因此在这个前缀之后它是获胜策略。特别地,因为 (\varphi_A) 与前缀无关,所以 (\rho) 也应该是获胜的,这就产生了矛盾,从而证明 (\rho \models \varPhi_{NE})。
1.2 计算纯纳什均衡的算法
通过结合相关命题的证明,有两种计算纯纳什均衡的方法:
- 方法一 :结合强最优和触发策略来计算。
- 方法二 :为每个 (A \in P) 计算集合 (W_{[-A]})(或者等价地计算 (W_A)),然后在博弈中计算满足公式 (\varPhi_{NE}) 的无限路径。例如,可以通过枚举可能的失败玩家集合,然后找到合适的最终周期性玩法来实
超级会员免费看
订阅专栏 解锁全文
100

被折叠的 条评论
为什么被折叠?



