66、传感器与信息空间解读

传感器与信息空间解读

1. 历史信息空间的定义

历史信息空间(history I - space)是通过对不同阶段信息空间取并集得到的。如果有 $K$ 个阶段,历史信息空间可表示为:
$I_{hist} = I_0 ∪ I_1 ∪ I_2 ∪ · · · ∪ I_K$ (11.18)

大多数情况下,阶段数不是固定的。此时,$I_{hist}$ 被定义为所有 $k \in {0} ∪ N$ 的 $I_k$ 的并集:
$I_{hist} = I_0 ∪ I_1 ∪ I_2 ∪ · · ·$ (11.19)

这个构造与随时间变化的运动规划中的状态空间相关。历史信息空间是与阶段相关的,因为信息会随时间积累。在离散模型中,时间仅通过阶段的使用隐式体现。阶段索引 $k$ 可以想象成历史信息空间的一个“轴”。

历史信息空间的一个直接问题是其 I - 状态可能会任意长,因为历史会随着阶段数线性增长。目前,将 $I_{hist}$ 抽象地想象成另一种状态空间是有帮助的,暂时不用太关注每个 $\eta \in I_{hist}$ 表示起来有多复杂。

2. 规划问题的定义

规划问题将直接在历史信息空间上定义,这在很多方面使它看起来像一个普通的状态空间。但要记住,它是从一个无法获得完美状态观测的状态空间推导而来的。

在之前的定义中,反馈计划是状态的函数,而这里反馈计划是 I - 状态的函数。因为在计划执行期间状态通常是未知的,所以决策不能基于状态,而 I - 状态总是已知的,因此基于它来做决策是合理的。

设 $\pi_K$ 表示一个 $K$ 步信息反馈计划,它是 $K$ 个函数的序

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值