57、基础决策理论与序列决策理论解析

基础与序列决策理论解析

基础决策理论与序列决策理论解析

1. 基础决策理论

1.1 决策分析方法

在决策过程中,有多种分析方法可供选择,如概率分析和最坏情况分析。以下面的成本矩阵为例:

U

1
1000
1
0

使用概率分析时,如果朋友很富有且银行账户可靠,我们可能会认为接受支票是最佳选择。然而,这种信息在决策过程中有时难以考虑周全。而使用最坏情况分析,最优行动则是选择收取 1 欧元现金。但这样做可能会让人在得知支票账户有足够资金可兑现 1000 欧元时感到后悔。

实际上,最坏情况分析下的非确定性模型可以看作是概率模型的一个特殊情况,即先验分布对最坏情况结果赋予高概率。但这种赋值的依据往往会受到质疑,就像贝叶斯分析中其他先验赋值也会受到批评一样。

1.2 博弈论的局限性

博弈论存在一些基本局限性。首先,每个玩家必须了解其他玩家的成本函数,但在实际中,确定单个决策者的合适成本函数都很困难,更不用说了解其他玩家的成本和动机了。一种解决办法是对其他玩家成本函数的不确定性进行建模,使用贝叶斯分析根据玩家的行动观察来推断成本,但这又会引发先验赋值的问题,还可能导致“无限反思”的困境。

其次,虽然使用随机策略可以保证鞍点或纳什均衡的存在,但这意味着对模型进行了重大改变。许多游戏只玩一次或少数几次,此时玩家很可能会感到后悔,尽管基于期望情况分析的理论表明后悔会被消除。

再者,智能人类玩家在多次玩游戏后可能会从根本上改变策略,而且人类很难模拟随机策略。在非零和游戏中,可能存在多个纳什均衡,这使得避免后悔变得

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值