决策理论规划:应对自然的策略与优化
在决策过程中,我们常常面临各种不确定性,就如同在一场与自然的博弈中。本文将深入探讨如何在这种不确定的环境中做出最优决策,介绍不同的决策模型和策略,并通过具体例子进行说明。
1. 随机策略在博弈中的重要性
在一些博弈场景中,随机策略能发挥关键作用。例如,在一个简单的博弈里,如果玩家 1 使用确定性策略,而玩家 2 能确定该策略,那么玩家 2 就能选择策略使自己总是获胜。但如果玩家 1 采用最佳随机策略,平均而言他至少能保持收支平衡。像著名的石头 - 剪刀 - 布游戏,就是这种多行动博弈的典型例子。若要设计一个与聪明对手反复玩此游戏的计算机程序,引入随机化似乎是最佳选择。
2. 与自然的博弈
2.1 自然的建模
在决策过程中,我们引入两个决策主体:机器人和自然。自然是一种不可预测的神秘力量,它有自己的行动集合,其行动会干扰机器人目标的实现。为了应对自然的不确定性,我们需要对其行为进行建模。
2.1.1 博弈的基本表述
我们可以将与自然的博弈表述如下:
- 机器人行动空间 (U):非空集合,其中每个 (u \in U) 称为一个行动。
- 自然行动空间 (\Theta):非空集合,每个 (\theta \in \Theta) 称为一个自然行动。
- 成本函数 (L : U \times \Theta \to R \cup {\infty}):该函数取决于机器人的行动 (u) 和自然的行动 (\theta)。当 (U) 和 (\Theta) 为有限集合时,可方便地将 (L) 表示为一个 (|U| \times |\Theta|) 的
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



