读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈可信性和序贯理性

转载于 2018-01-03 15:03:00 发布 · 424 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/steven-yang/p/8183803.html

本文探讨了博弈论中序贯理性和逆向归纳法的概念，详细解释了如何通过逆向归纳法求解有限完美信息博弈的纳什均衡。此外，还介绍了子博弈精炼均衡的概念及其在博弈论中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈可信性和序贯理性

可信性和序贯理性(Credibility and Sequential Rationality)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

序贯理性和逆向归纳法(Sequential Rationality and Backward Induction)

序贯理性(Sequential Rationality)
序贯理性是一个原则：在博弈树的每一个信息集上，玩家总是使用最佳策略。
这意味着，无论是否在均衡路径上，博弈次序的每个阶段，玩家都是在做理智的选择。
序贯理性(Sequential Rationality)
给定玩家i对手的策略组合\(\sigma_{-i} \in \Delta S_{-i}\)，玩家策略\(\sigma_i\)是序贯理性的，
当且仅当玩家i在每个信息集上，总是选择\(\sigma_{-i}\)最佳响应。

方法 - 逆向归纳法解:

从末端节点开始，在上一层的每个节点的收益组合为节点玩家的（子节点的）最佳收益组合。
以此类推，直到根节点。根节点上的收益组合（可能是多个）的博弈路径为逆向归纳法解。

推论8.1 (Zermelo's Theorem)

任何有限完美信息博弈都有一个逆向归纳法解，而且是顺序合理的。
此外，如果没有两个末端节点有（对每个玩家）相同的收益，则逆向归纳法解是唯一的。

推论

任何有限完美信息博弈至少有一个顺序合理的纯策略形式的纳什均衡。
此外，如果没有两个末端节点有（对每个玩家）相同的收益，则有唯一的顺序合理的纳什均衡。

适当的子博弈(proper subgame)
博弈\(\Gamma\)的一个适当子博弈\(G\)只包含一个节点和它所有子孙节点，并具有性质：
如果\(s \in G\)并且\(x' \in h(x)\)，则\(x' \in G\) - 属于子博弈\(G\)的节点，这个节点的信息集包含的所有节点都属于这个子博弈\(G\)。
子博弈精炼均衡(subgame-perfect (Nash) equilibrium)
在一个扩展形式博弈\(\Gamma\)中，如果对于每一个子博弈\(G\)，\(\sigma^*\)都是\(G\)中的纳什均衡，则行为策略组合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一个子博弈精炼均衡。

事实

对于任何有限完美信息博弈，子博弈精炼纳什均衡的集合和逆向归纳法的纳什均衡的集合是一致的。

参照

转载于:https://www.cnblogs.com/steven-yang/p/8183803.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。