传感器与信息空间解读
1. 历史信息空间的定义
历史信息空间(history I - space)是通过对不同阶段信息空间取并集得到的。如果有 $K$ 个阶段,历史信息空间可表示为:
$I_{hist} = I_0 ∪ I_1 ∪ I_2 ∪ · · · ∪ I_K$ (11.18)
大多数情况下,阶段数不是固定的。此时,$I_{hist}$ 被定义为所有 $k \in {0} ∪ N$ 的 $I_k$ 的并集:
$I_{hist} = I_0 ∪ I_1 ∪ I_2 ∪ · · ·$ (11.19)
这个构造与随时间变化的运动规划中的状态空间相关。历史信息空间是与阶段相关的,因为信息会随时间积累。在离散模型中,时间仅通过阶段的使用隐式体现。阶段索引 $k$ 可以想象成历史信息空间的一个“轴”。
历史信息空间的一个直接问题是其 I - 状态可能会任意长,因为历史会随着阶段数线性增长。目前,将 $I_{hist}$ 抽象地想象成另一种状态空间是有帮助的,暂时不用太关注每个 $\eta \in I_{hist}$ 表示起来有多复杂。
2. 规划问题的定义
规划问题将直接在历史信息空间上定义,这在很多方面使它看起来像一个普通的状态空间。但要记住,它是从一个无法获得完美状态观测的状态空间推导而来的。
在之前的定义中,反馈计划是状态的函数,而这里反馈计划是 I - 状态的函数。因为在计划执行期间状态通常是未知的,所以决策不能基于状态,而 I - 状态总是已知的,因此基于它来做决策是合理的。
设 $\pi_K$ 表示一个 $K$ 步信息反馈计划,它是 $K$ 个函数的序
超级会员免费看
订阅专栏 解锁全文
998

被折叠的 条评论
为什么被折叠?



