顺序决策理论与连续状态空间规划
1. 顺序博弈中的纳什均衡
在顺序博弈的情境下,纳什均衡的计算和应用面临着诸多挑战。在阶段式模型中,可使用自底向上的技术来计算确定性和随机化的纳什均衡,不过这通常只能计算出单个纳什均衡。若要表示所有的纳什均衡,则难度显著增加。此时,需将博弈树分解为多个矩阵博弈,找出并记录每个矩阵博弈中的所有纳什均衡及其对应的成本。在树的向上传播过程中,要传播一组成本向量以及与每个成本向量相关的行动,并且可以剔除不可行的纳什均衡,仅传播可行的纳什均衡及其成本。
当引入玩家P1和P2的成本函数L1和L2时,值迭代方法也能类似地进行扩展。对于每个状态和阶段的组合,需维护多个值向量及其对应的行动,这些对应于可行的纳什均衡。然而,纳什均衡的非唯一性在顺序博弈中造成了极大的困难。一般来说,顺序博弈中的均衡数量比单阶段博弈多得多,因此该概念在规划方法的设计中实用性欠佳,但在模拟复杂经济系统的可能结果方面可能更具价值。
2. 引入自然玩家
自然玩家可以很容易地被引入到博弈中。以零和博弈为例,引入自然玩家后就有了三个玩家:P1、P2和自然。在图10.19所示的单阶段零和博弈中,假设所有玩家同时行动,符合阶段式模型。若使用概率不确定性来建模自然玩家,已知自然选择左分支的概率为1/3,选择右分支的概率为2/3。根据自然选择的分支,P1和P2将进行特定的2×2矩阵博弈。
| 概率 | 成本矩阵 |
|---|---|
| 1/3 | (\begin{bmatrix}3 & |
超级会员免费看
订阅专栏 解锁全文
8万+

被折叠的 条评论
为什么被折叠?



