7、离散规划中的价值迭代与迪杰斯特拉算法详解

离散规划中的价值迭代与迪杰斯特拉算法详解

在离散规划领域,动态规划是一种强大的工具,可用于寻找最优路径和解决方案。本文将深入探讨正向价值迭代、可变长度规划的价值迭代以及迪杰斯特拉算法的相关内容。

1. 正向价值迭代

正向价值迭代是一种计算从初始阶段到各阶段最优成本到状态的方法。与反向价值迭代不同,正向价值迭代需要固定初始状态 (x_I),而反向价值迭代需要固定目标状态集合 (X_G)。

为了确保所有考虑的计划都从 (x_I) 开始,引入了一个新函数 (l_I),定义如下:
[C_1^*(x_1) = l_I(x_1)]
其中,(l_I(x_I) = 0),对于所有 (x \neq x_I),(l_I(x) = \infty)。这样,任何试图从非 (x_I) 状态开始的计划将立即获得无穷大的成本。

对于中间阶段 (k \in {2, \ldots, K}),最优成本到状态的计算公式为:
[C_k^*(x_k) = \min_{u_1, \ldots, u_{k - 1}} \left[ l_I(x_1) + \sum_{i = 1}^{k - 1} l(x_i, u_i) \right]]

最终阶段 (F) 的成本到状态为:
[C_K^*(x_F) = \min_{u_1, \ldots, u_K} \left[ l_I(x_1) + \sum_{i = 1}^{K} l(x_i, u_i) \right]]

正向价值迭代的动态规划递推公式为:
[C_k^ (x_k) = \min_{u^{-1} \in U^{-1}(x_k)} \left[ C_{k - 1}

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值