可解释性度量:让机器人行为更易理解
1. 规划模型
在处理规划问题时,我们使用目标导向的 STRIPS 规划模型来表示相关问题。该模型可以用元组 (M = \langle F, A, I, G, C \rangle) 表示,各元素含义如下:
- (F) :一组命题流,定义了可能的任务状态空间。每个状态对应命题的特定实例化,状态集合用 (S) 表示。若需要,可通过在给定状态中为真的流子集唯一标识每个状态。不在集合表示中的命题在该状态下为假。
- (A) :代理可用的动作集合。每个动作 (a_i \in A) 由元组 (a_i = \langle pre(a_i), adds(a_i), dels(a_i) \rangle) 描述:
- (pre(a_i)) :执行动作的前提条件。通常遵循 STRIPS 执行语义,动作只能在满足前提条件的状态下执行。前提条件可以是关于 (F) 中命题流的任何逻辑公式,多数情况下是状态流子集的合取公式,可等价表示为这些流的集合。若前提条件中的流集合是给定状态中为真的流集合的子集,则动作 (a_i) 在该状态下可执行,即 (pre(a_i) \subseteq s_k)。
- (adds(a_i)/dels(a_i)) :动作 (a_i) 的添加和删除效果,共同捕捉在状态中执行该动作的效果。添加效果表示动作将使其为真的状态流集合,删除效果表示将变为假的状态流集合。在状态 (s_j) 中执行动作 (a_i) 会得到状态 (s_k = (s_j \setminus dels(a_i)) \cup adds(a
超级会员免费看
订阅专栏 解锁全文
819

被折叠的 条评论
为什么被折叠?



