82、基于线性规划的最优规划启发式方法

基于线性规划的最优规划启发式方法

1. 引言

在规划领域,一种基于线性规划(LP)的启发式方法在处理具有非均匀动作成本、目标效用以及目标效用之间依赖关系的超额预订规划中表现出色。本文将详细介绍该方法的动作选择公式化、实验结果以及相关工作。

2. 动作选择公式化

为了更好地进行规划问题的松弛处理,我们采用多值流(其中布尔流是特殊情况),并使用SAS + 形式主义作为开发背景,而非常见的STRIPS/ADL形式主义。SAS + 形式主义通过动作的前置条件、后置条件和持续条件来定义动作。为了简化规划与网络流之间的联系,我们将注意力限制在SAS + 的一个子类中,即每个对某个流有后置条件的动作也对该流有前置条件,但这一限制仅为便于阐述,可轻易去除。

2.1 符号表示

我们将SAS + 规划任务定义为一个元组Π = ⟨C, A, s0, s∗⟩,其中:
- C :是一个有限的状态变量集合,每个状态变量c都有一个关联的域Vc和一个隐式定义的扩展域V + c = Vc ∪{u},u表示未定义的值。对于每个状态变量c,s[c]表示状态s中c的值。当且仅当s[c] ≠ u时,称c的值在状态s中是定义的。总状态空间S = Vc1 × … × Vcn和部分状态空间S+ = V + c1 × … × V + cn是隐式定义的。
- A :是一个有限的动作集合,形式为⟨pre, post, prev⟩,其中pre表示前置条件,post表示后置条件,prev表示持续条件。对于每个动作a,pre[c]、post[c]和prev[c]分别表示状态变量c的相应条件。所有动

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值