推理规划代理的混合架构与拓扑地图学习
推理规划代理的混合架构
在规划领域,操作符(也称为动作)集合 Op 可应用于计划中。每个动作 a 属于 Op,由前置条件 Ca(执行动作必须满足的条件)和后置条件 Ea(动作执行后必须满足的条件)来描述。
一个计划 P 是一个元组 ,各部分含义如下:
- S 是计划动作的集合。有两个特殊动作:tI,其效果为初始状态 I;tG,其前置条件为目标规范 G。
- O 是 S 上的一个排序关系,用于确定计划动作之间的顺序。tI 总是第一个动作,tG 总是最后一个动作。如果排序关系是全序的,P 是线性计划;如果是偏序关系,P 是非线性计划。
- B 是一个集合,用于描述 P 中出现的变量的绑定和禁止绑定。
- L 是一种形式为 's s p ⎯→ ⎯ 的因果链接集合,其中 s, s’ 属于 S,p 属于 Es 且 p 属于 Cs’,用于建立计划动作之间的联系。
当对于每个不等于 tI 的动作 s,对于每个 p 属于 Cs 都存在一个因果链接 's s p ⎯→ ⎯ ,并且对于每个不等于 tG 的动作 s 至少存在一个因果链接 ''s s q ⎯→ ⎯ 时,计划 P 构成解决规划问题的解决方案。如果规划器想保留计划中的失败或意外情况,这些情况用一组公式 F 表示。
以下是一个 mermaid 流程图展示计划 P 的相关关系:
graph LR
classDef process fill:#E5F6FF,stroke:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



