7、离散规划中的动态规划方法详解

动态规划在离散规划中的应用

离散规划中的动态规划方法详解

1. 引言

在离散规划领域,动态规划是一种强大的工具,用于解决各种最优规划问题。本文将详细介绍离散规划中的几种动态规划方法,包括前向值迭代、可变长度计划的最优规划以及对 Dijkstra 算法的重新审视。

2. 前向值迭代

2.1 基本概念

前向值迭代是一种计算从初始阶段到各阶段最优成本到状态的方法。与后向值迭代不同,后向值迭代能同时从所有初始状态找到最优计划,而前向值迭代则用于找到到达所有状态的最优计划。在后向值迭代中,目标集 $X_G$ 必须固定;而在前向值迭代中,初始状态 $x_I$ 必须固定。

2.2 最优成本到状态的定义

设 $C^ _k$ 表示从阶段 1 到阶段 $k$ 的最优成本到状态,通过对所有 $(k - 1)$ 步计划进行优化得到。为了排除不从 $x_I$ 开始的计划,$C^ _1$ 的定义如下:
$C^*_1(x_1) = l_I(x_1)$
其中,$l_I$ 是一个新函数,满足 $l_I(x_I) = 0$,对于所有 $x \neq x_I$,$l_I(x) = \infty$。这样,任何试图从非 $x_I$ 状态开始的计划将立即获得无穷大的成本。

对于中间阶段 $k \in {2, \ldots, K}$,最优成本到状态的计算公式为:
$C^* k(x_k) = \min {u_1, \ldots, u_{k - 1}} \left[ l_I(x_1) + \sum_{i = 1}^{k - 1} l(x_i, u_i) \right]$

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值