44、动态随机带时间窗车辆路径问题的多阶段随机规划方法

动态随机带时间窗车辆路径问题的多阶段随机规划方法

1. 问题引入与示例

在一个简单的非预期性示例中,时间 $t = 1$ 时,有一辆车位于顶点 $a$,此时有两个可行行动:前往顶点 $b$ 或前往顶点 $c$。这里考虑两个等概率场景,它们在时间 2 和 3 没有请求揭示,但在时间 4 揭示不同请求。

当使用有非预期性约束的方程(1)时,选择前往 $c$,因为此时预期成本为 1。在时间 4,只剩一个场景,如果是场景 $\xi_1$(或 $\xi_2$),请求 $(d, 4)$(或 $(g, 4)$)将被拒绝。而使用无此约束的方程(2)时,选择前往 $b$,预期成本为 0。不过若前往 $b$,在时间 3 需在前往 $d$ 或 $g$ 中选择,此时两个行动的预期成本均为 1.5。这表明多阶段问题(1)的非预期性约束能带来比两阶段松弛(2)更好的行动。

两阶段随机问题方程(2)为:
[
a_t = \arg \min_{a_t \in A(\xi_t)} E_{\xi_{t + 1}..H}[\min_{a_{t + 1}..H \in A(\xi_{t + 1}..H)} \omega(a_0..H)]
]
方程(1)强制实施非预期性约束,在每个 $t’ > t$ 时,仅考虑使关于 $\xi_{t’}$ 的期望最小化的行动 $a_{t’}$,不考虑 $\xi_{t’+1..H}$ 的可能实现。方程(2)不实施这些约束,为每个实现 $\xi_{t + 1}..H \in \xi_{t + 1}..H$ 考虑最佳序列 $a_{t + 1}..H$。因此,方程(1)可能导致 $\omega$ 的期望比方程(2)大,但在某些请求在时间 $t$ 未揭

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值