7、离散规划中的价值迭代与迪杰斯特拉算法详解

白露未晞593

于 2025-08-09 13:54:52 发布

阅读量8

点赞数

CC 4.0 BY-SA版权

分类专栏：规划算法：智能决策之钥文章标签：离散规划价值迭代正向价值迭代

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bash7scripter/article/details/154634788

规划算法：智能决策之钥专栏收录该内容

100 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

离散规划中的价值迭代与迪杰斯特拉算法详解

在离散规划领域，动态规划是一种强大的工具，可用于寻找最优路径和解决方案。本文将深入探讨正向价值迭代、可变长度规划的价值迭代以及迪杰斯特拉算法的相关内容。

1. 正向价值迭代

正向价值迭代是一种计算从初始阶段到各阶段最优成本到状态的方法。与反向价值迭代不同，正向价值迭代需要固定初始状态 (x_I)，而反向价值迭代需要固定目标状态集合 (X_G)。

为了确保所有考虑的计划都从 (x_I) 开始，引入了一个新函数 (l_I)，定义如下：
[C_1^*(x_1) = l_I(x_1)]
其中，(l_I(x_I) = 0)，对于所有 (x \neq x_I)，(l_I(x) = \infty)。这样，任何试图从非 (x_I) 状态开始的计划将立即获得无穷大的成本。

对于中间阶段 (k \in {2, \ldots, K})，最优成本到状态的计算公式为：
[C_k^*(x_k) = \min_{u_1, \ldots, u_{k - 1}} \left[ l_I(x_1) + \sum_{i = 1}^{k - 1} l(x_i, u_i) \right]]

最终阶段 (F) 的成本到状态为：
[C_K^*(x_F) = \min_{u_1, \ldots, u_K} \left[ l_I(x_1) + \sum_{i = 1}^{K} l(x_i, u_i) \right]]

正向价值迭代的动态规划递推公式为：
[C_k^ (x_k) = \min_{u^{-1} \in U^{-1}(x_k)} \left[ C_{k - 1}

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。