重复博弈与随机博弈:从有限自动机到图灵机的探索
在博弈论中,重复博弈和随机博弈是两个重要的概念。重复博弈涉及到同一博弈的多次重复进行,而随机博弈则是在一系列普通形式的博弈中进行选择。本文将深入探讨重复博弈中的有限理性问题,特别是通过有限自动机和图灵机来表示策略,并分析随机博弈的基本概念。
重复博弈与民间定理
在重复博弈中,当一个玩家对对手采用的最小最大策略做出最佳反应时,他恰好获得其最小最大值。定理 6.1.5 是民间定理大家族中的一个实例。该定理最初限定于无限重复博弈、平均回报、纳什均衡和完全信息博弈。然而,实际上存在适用于其他条件的民间定理,例如具有折扣回报的无限重复博弈(当折扣因子足够大时)、有限重复博弈、子博弈完美均衡(即玩家仅对偏离者进行有限惩罚)以及不完全信息博弈。这些民间定理的核心信息基本一致:重复博弈均衡中的支付本质上仅受可执行性和可行性的限制。
有限理性:自动机参与的重复博弈
以往我们通常假设玩家能够进行任意深度的推理和相互建模,而不考虑其复杂性。但在现实中,这一假设存在疑问,例如在象棋比赛中,如果玩家都能完美地进行推理,比赛就失去了意义。因此,我们需要探讨当玩家并非完全理性的期望效用最大化者时会发生什么,特别是当我们对他们施加特定的计算限制时。
以囚徒困境为例,在有限重复的囚徒困境博弈中,理论上每个玩家的占优策略(也是唯一的纳什均衡)是在每次迭代中都选择策略 D。然而,在现实中,人们在游戏初期往往会有大量的合作行为。这种理论与现实的差异促使我们寻找能够解释这一现象的模型。
早期文献中提出了基于 ǫ - 均衡的概念。ǫ - 均衡是一种策略组合,其中任何玩家改变策略所获得的收益都不超过 ǫ,纳什均衡是
超级会员免费看
订阅专栏 解锁全文
885

被折叠的 条评论
为什么被折叠?



