3、博弈论、验证与控制器综合的研究进展

最新推荐文章于 2025-10-19 13:44:31 发布

人间清醒863

最新推荐文章于 2025-10-19 13:44:31 发布

阅读量6

点赞数

CC 4.0 BY-SA版权

分类专栏：自动化验证的前沿探索文章标签：博弈论纳什均衡嫌疑博弈

本文链接：https://blog.youkuaiyun.com/gpu4optimizer/article/details/153557363

自动化验证的前沿探索专栏收录该内容

62 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

博弈论、验证与控制器综合的研究进展

1 博弈论与验证中的纳什均衡

1.1 策略应用与公式满足性

在博弈论中，我们将某个结果应用到从初始状态 (v_{init}) 开始的每个博弈 (G[A]) 中。对于玩家 (A) 在 (G[A]) 中的对应强最优策略，我们记为 (\sigma_A)。我们来论证策略组合 (\sigma = (\sigma_A) {A \in P}) 的主要结果 (\rho) 为何满足公式 (\varPhi {NE})。假设 (\rho \not\models \varphi_A)，通过反证法，假设沿着 (\rho) 路径上的某个访问顶点 (v)（在某个前缀 (\pi) 之后）不属于 (W_{[-A]})。根据证明开头提到的强确定性结果，这意味着顶点 (v) 属于 (W_A)。由于 (\sigma_A) 是强最优策略，在经过前缀 (\pi) 之后它仍然是最优的，因此在这个前缀之后它是获胜策略。特别地，因为 (\varphi_A) 与前缀无关，所以 (\rho) 也应该是获胜的，这就产生了矛盾，从而证明 (\rho \models \varPhi_{NE})。

1.2 计算纯纳什均衡的算法

通过结合相关命题的证明，有两种计算纯纳什均衡的方法：
- 方法一 ：结合强最优和触发策略来计算。
- 方法二 ：为每个 (A \in P) 计算集合 (W_{[-A]})（或者等价地计算 (W_A)），然后在博弈中计算满足公式 (\varPhi_{NE}) 的无限路径。例如，可以通过枚举可能的失败玩家集合，然后找到合适的最终周期性玩法来实

会员秒杀 ¥9.9 重磅福利

超级会员免费看