离散规划中的价值迭代与迪杰斯特拉算法详解
在离散规划领域,动态规划是一种强大的工具,可用于寻找最优路径和解决方案。本文将深入探讨正向价值迭代、可变长度规划的价值迭代以及迪杰斯特拉算法的相关内容。
1. 正向价值迭代
正向价值迭代是一种计算从初始阶段到各阶段最优成本到状态的方法。与反向价值迭代不同,正向价值迭代需要固定初始状态 (x_I),而反向价值迭代需要固定目标状态集合 (X_G)。
为了确保所有考虑的计划都从 (x_I) 开始,引入了一个新函数 (l_I),定义如下:
[C_1^*(x_1) = l_I(x_1)]
其中,(l_I(x_I) = 0),对于所有 (x \neq x_I),(l_I(x) = \infty)。这样,任何试图从非 (x_I) 状态开始的计划将立即获得无穷大的成本。
对于中间阶段 (k \in {2, \ldots, K}),最优成本到状态的计算公式为:
[C_k^*(x_k) = \min_{u_1, \ldots, u_{k - 1}} \left[ l_I(x_1) + \sum_{i = 1}^{k - 1} l(x_i, u_i) \right]]
最终阶段 (F) 的成本到状态为:
[C_K^*(x_F) = \min_{u_1, \ldots, u_K} \left[ l_I(x_1) + \sum_{i = 1}^{K} l(x_i, u_i) \right]]
正向价值迭代的动态规划递推公式为:
[C_k^ (x_k) = \min_{u^{-1} \in U^{-1}(x_k)} \left[ C_{k - 1}
超级会员免费看
订阅专栏 解锁全文
1214

被折叠的 条评论
为什么被折叠?



