基于线性规划的最优规划启发式方法
1. 引言
在规划领域,一种基于线性规划(LP)的启发式方法在处理具有非均匀动作成本、目标效用以及目标效用之间依赖关系的超额预订规划中表现出色。本文将详细介绍该方法的动作选择公式化、实验结果以及相关工作。
2. 动作选择公式化
为了更好地进行规划问题的松弛处理,我们采用多值流(其中布尔流是特殊情况),并使用SAS + 形式主义作为开发背景,而非常见的STRIPS/ADL形式主义。SAS + 形式主义通过动作的前置条件、后置条件和持续条件来定义动作。为了简化规划与网络流之间的联系,我们将注意力限制在SAS + 的一个子类中,即每个对某个流有后置条件的动作也对该流有前置条件,但这一限制仅为便于阐述,可轻易去除。
2.1 符号表示
我们将SAS + 规划任务定义为一个元组Π = ⟨C, A, s0, s∗⟩,其中:
- C :是一个有限的状态变量集合,每个状态变量c都有一个关联的域Vc和一个隐式定义的扩展域V + c = Vc ∪{u},u表示未定义的值。对于每个状态变量c,s[c]表示状态s中c的值。当且仅当s[c] ≠ u时,称c的值在状态s中是定义的。总状态空间S = Vc1 × … × Vcn和部分状态空间S+ = V + c1 × … × V + cn是隐式定义的。
- A :是一个有限的动作集合,形式为⟨pre, post, prev⟩,其中pre表示前置条件,post表示后置条件,prev表示持续条件。对于每个动作a,pre[c]、post[c]和prev[c]分别表示状态变量c的相应条件。所有动
超级会员免费看
订阅专栏 解锁全文
267

被折叠的 条评论
为什么被折叠?



