基础决策理论与序列决策理论解析
1. 基础决策理论
1.1 决策分析方法
在决策过程中,有多种分析方法可供选择,如概率分析和最坏情况分析。以下面的成本矩阵为例:
U
1
1000
1
0
使用概率分析时,如果朋友很富有且银行账户可靠,我们可能会认为接受支票是最佳选择。然而,这种信息在决策过程中有时难以考虑周全。而使用最坏情况分析,最优行动则是选择收取 1 欧元现金。但这样做可能会让人在得知支票账户有足够资金可兑现 1000 欧元时感到后悔。
实际上,最坏情况分析下的非确定性模型可以看作是概率模型的一个特殊情况,即先验分布对最坏情况结果赋予高概率。但这种赋值的依据往往会受到质疑,就像贝叶斯分析中其他先验赋值也会受到批评一样。
1.2 博弈论的局限性
博弈论存在一些基本局限性。首先,每个玩家必须了解其他玩家的成本函数,但在实际中,确定单个决策者的合适成本函数都很困难,更不用说了解其他玩家的成本和动机了。一种解决办法是对其他玩家成本函数的不确定性进行建模,使用贝叶斯分析根据玩家的行动观察来推断成本,但这又会引发先验赋值的问题,还可能导致“无限反思”的困境。
其次,虽然使用随机策略可以保证鞍点或纳什均衡的存在,但这意味着对模型进行了重大改变。许多游戏只玩一次或少数几次,此时玩家很可能会感到后悔,尽管基于期望情况分析的理论表明后悔会被消除。
再者,智能人类玩家在多次玩游戏后可能会从根本上改变策略,而且人类很难模拟随机策略。在非零和游戏中,可能存在多个纳什均衡,这使得避免后悔变得
基础与序列决策理论解析
超级会员免费看
订阅专栏 解锁全文
2713

被折叠的 条评论
为什么被折叠?



