57、基础决策理论与序列决策理论解析

基础与序列决策理论解析

白露未晞593

于 2025-09-28 14:51:03 发布

阅读量10

点赞数

CC 4.0 BY-SA版权

分类专栏：规划算法：智能决策之钥文章标签：基础决策理论序列决策理论博弈论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bash7scripter/article/details/154635017

规划算法：智能决策之钥专栏收录该内容

100 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基础决策理论与序列决策理论解析

1. 基础决策理论

1.1 决策分析方法

在决策过程中，有多种分析方法可供选择，如概率分析和最坏情况分析。以下面的成本矩阵为例：

使用概率分析时，如果朋友很富有且银行账户可靠，我们可能会认为接受支票是最佳选择。然而，这种信息在决策过程中有时难以考虑周全。而使用最坏情况分析，最优行动则是选择收取 1 欧元现金。但这样做可能会让人在得知支票账户有足够资金可兑现 1000 欧元时感到后悔。

实际上，最坏情况分析下的非确定性模型可以看作是概率模型的一个特殊情况，即先验分布对最坏情况结果赋予高概率。但这种赋值的依据往往会受到质疑，就像贝叶斯分析中其他先验赋值也会受到批评一样。

1.2 博弈论的局限性

博弈论存在一些基本局限性。首先，每个玩家必须了解其他玩家的成本函数，但在实际中，确定单个决策者的合适成本函数都很困难，更不用说了解其他玩家的成本和动机了。一种解决办法是对其他玩家成本函数的不确定性进行建模，使用贝叶斯分析根据玩家的行动观察来推断成本，但这又会引发先验赋值的问题，还可能导致“无限反思”的困境。

其次，虽然使用随机策略可以保证鞍点或纳什均衡的存在，但这意味着对模型进行了重大改变。许多游戏只玩一次或少数几次，此时玩家很可能会感到后悔，尽管基于期望情况分析的理论表明后悔会被消除。

再者，智能人类玩家在多次玩游戏后可能会从根本上改变策略，而且人类很难模拟随机策略。在非零和游戏中，可能存在多个纳什均衡，这使得避免后悔变得

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。