40、自动化规划:经典规划与算法解析

自动化规划:经典规划与算法解析

1. 经典规划的定义

经典规划是在离散、确定、静态和完全可观察的环境中,寻找一系列行动以实现目标的任务。以往的两种方法,即第3章的问题解决代理和第7章的混合命题逻辑代理,存在两个局限性:一是每个新领域都需要特定的启发式方法;二是需要显式表示指数级大的状态空间。

为应对这些局限,研究人员采用了一种基于PDDL(规划领域定义语言)的分解表示法。基本的PDDL可处理经典规划领域,其扩展还能处理连续、部分可观察、并发和多智能体等非经典领域。

在PDDL中,状态表示为基础原子流的合取。例如, Poor∧Unknown 可表示一个不幸智能体的状态, At(Truck1,Melbourne)∧At(Truck2,Sydney) 可表示包裹配送问题中的一个状态。

动作模式表示一组基础动作。例如,飞机从一个地点飞到另一个地点的动作模式如下:

Action(Fly(p,from,to),
PRECOND:At(p,from)∧Plane(p)∧Airport(from)∧Airport(to)
EFFECT:¬At(p,from)∧At(p,to))

当状态s蕴含动作a的前提条件时,动作a在状态s中适用。执行适用动作a在状态s中的结果定义为状态s′,通过从s中移除动作效果中的负文字流(删除列表),并添加正文字流(添加列表)得到:

RESULT(s,a) = (s−DEL(a))∪
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值