顺序决策理论中的规划算法与无限期问题
在决策理论规划领域,为了解决不同场景下的规划问题,存在多种算法和策略。下面将详细介绍这些算法及其适用场景。
1. 反向投影算法
反向投影算法是一种用于在非确定性不确定性下计算可行计划的通用算法,其步骤如下:
1. 初始化:令 $S = X_G$,并对每个 $x \in X_G$,设置 $\pi(x) = u_T$。
2. 对于每个 $x \in X \setminus S$,若存在 $u \in U(x)$ 使得 $x \in SB(S, u)$,则:
- 令 $\pi(x) = u$。
- 将 $x$ 插入到 $S$ 中。
3. 若步骤 2 未能扩展 $S$,则退出。这意味着 $SB(S) = S$,无法再取得进展。否则,返回步骤 2。
该算法的流程可以用如下 mermaid 流程图表示:
graph TD;
A[初始化 S = XG, π(x) = uT for x ∈ XG] --> B[检查 x ∈ X \ S];
B --> C{是否存在 u 使 x ∈ SB(S, u)};
C -- 是 --> D[π(x) = u, 插入 x 到 S];
D --> E{是否能扩展 S};
E -- 是 --> B;
E -- 否 --> F[退出];
C -- 否 --> E;
在算法执行过程中,若找到改进的计划,将 $\pi$ 替换为 $\pi’$ 并返回步骤 2。例如,新计
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



