传感器与信息空间:从历史信息空间到派生信息空间的探索
1. 历史信息空间的定义与特性
历史信息空间(history I - space)是通过对不同阶段信息空间取并集来构建的。如果存在 $K$ 个阶段,历史信息空间可表示为:
[I_{hist} = I_0 \cup I_1 \cup I_2 \cup \cdots \cup I_K]
多数情况下,阶段数量并非固定,此时历史信息空间定义为所有 $k \in {0} \cup N$ 对应的 $I_k$ 的并集:
[I_{hist} = I_0 \cup I_1 \cup I_2 \cup \cdots]
历史信息空间与随时间变化的运动规划中的状态空间相关。它具有阶段依赖性,因为信息会随时间积累。在离散模型中,时间的概念通过阶段来隐式体现。可以将阶段索引 $k$ 想象成历史信息空间的一个“轴”。
不过,历史信息空间存在一个问题,即其 I - 状态可能会任意长,因为历史信息会随阶段数量线性增长。目前,可以将 $I_{hist}$ 抽象地看作另一种状态空间,暂时不考虑每个 $\eta \in I_{hist}$ 表示起来可能有多复杂。在很多情况下,存在简化信息空间的方法。
2. 规划问题的定义
规划问题直接在历史信息空间上定义,这使得它在很多方面看起来像一个普通的状态空间。但要记住,它是从无法获得完美状态观测的另一个状态空间推导而来的。
在之前,反馈计划被定义为状态的函数,而在这里,反馈计划是 I - 状态的函数。因为在计划执行过程中状态通常是未知的,而 I - 状态总是已知的,所以基于 I - 状态做决策是合理的。
设 $\
从历史到派生信息空间的演进
超级会员免费看
订阅专栏 解锁全文
3382

被折叠的 条评论
为什么被折叠?



