自动跨域任务计划转移技术解析
1. 问题定义
在任务规划领域,我们需要对相关概念进行明确的定义。
- 任务规划域 :一个任务规划域 (D = (S, A, T)) 由状态空间 (S)(可以是连续或离散的)、动作空间 (A) 以及离散转移集合 (T \subseteq S \times A \times S) 组成。域中的转移是确定性的,即对于任意 ((S, a, S’) \in T),不存在 (S’’ \in S) 使得 ((S, a, S’‘) \in T)。执行 (E) 是状态和动作交替的序列,即 (E = (S_0, a_1, S_1, a_2, \ldots, a_n, S_n))。若对于所有 (i \in {1, \ldots, n}),((S_{i - 1}, a_i, S_i) \in T),则执行 (E) 在该域中是可行的,此时称 (E) 由动作序列 ((a_1, \ldots, a_n)) 诱导。
- 经典任务规划问题 :一个经典任务规划问题 (P = (D, S_{start}, S_{goal})) 由域 (D)、起始状态 (S_{start} \in S) 和目标状态 (S_{goal} \in S) 组成。为了解决 (P),我们需要找到一个动作序列 ((a_1, \ldots, a_n) \in A^n),从 (S_{start}) 开始应用该序列,能在 (D) 中诱导出一个可行的执行,并终止于 (S_{goal})。成功解决 (P) 的计划被称为技能。
- 技能转移 :考虑一个解决规划问题 (P = (D, S_{start}, S_{goal})) 的技能
超级会员免费看
订阅专栏 解锁全文

1997

被折叠的 条评论
为什么被折叠?



