非合作博弈:从基础到贝叶斯模型
1. 扩展式博弈的子博弈完美均衡
在扩展式博弈中,我们可以通过逆向归纳法来寻找子博弈完美均衡。具体步骤如下:
1. 长度为 1 的子博弈 :存在四个长度为 1 的子博弈,在这些子博弈中,玩家 2 需进行行动选择。玩家 2 在最左边和最右边的子博弈中无差异,在另外两个子博弈中有唯一最优行动。因此,玩家 2 共有四个最优策略,分别为 0100、0101、1100 和 1101。
2. 长度为 2 的子博弈 :有两个长度为 2 的子博弈,均以机会行动开始。对于玩家 2 的四种选择,我们可以计算出两个玩家的期望收益。
- 在左机会节点,期望收益分别为 (5/3,1)、(5/3,1)、(7/3,1) 和 (7/3,1)。
- 在右机会节点,期望收益分别为 (6/4,2)、(7/4,2)、(6/4,2) 和 (7/4,2)。
3. 长度为 3 的子博弈(即整个游戏) :只有一个长度为 3 的子博弈,玩家 1 在根节点需决定选择 A 还是 B。对于玩家 2 的每个最优行动,玩家 1 比较其期望收益,发现只有当玩家 2 选择策略 0101 时,玩家 1 应选择 B。因此,我们确定了四个子博弈完美均衡,分别为 (A,0100)、(B,0101)、(A,1100) 和 (A,0101)。
通过逆向归纳法得到的策略组合恰好是游戏的子博弈完美均衡。当所有玩家的行动空间有限时,逆向归纳法总能终止,这意味着每个节点具有有限分支的扩展式博弈至少有一个子博弈完美均衡。
2. 贝叶斯博弈的引入
在
超级会员免费看
订阅专栏 解锁全文
1583

被折叠的 条评论
为什么被折叠?



