69、传感器与信息空间:连续状态下的信息处理

传感器与信息空间:连续状态下的信息处理

1. 历史信息状态与空间

将 $\tilde{u}_t$ 和 $\tilde{y}_t$ 与初始条件 $\eta_0$ 相结合,可得到时间 $t$ 时的历史信息状态:
$\eta_t = (\eta_0, \tilde{u}_t, \tilde{y}_t)$ (11.53)

时间 $t$ 时的历史信息空间是所有可能的 $\eta_t$ 的集合,记为 $I_t$。需要注意的是,$I_t$ 是一个函数空间,因为每个 $\eta_t \in I_t$ 都是时间的函数。在离散阶段的情况下,每个 $I_k$ 会使用(11.18)或(11.19)组合成一个单一的历史信息空间 $I_{hist}$。连续时间的类似情况可表示为:
$I_{hist} = \bigcup_{t\in T} I_t$ (11.54)

这是一个不规则的函数集合,因为它们具有不同的定义域;这种不规则性在离散阶段的情况中也会出现,其中 $I_{hist}$ 由不同长度的序列组成。

可以给出公式 11.1 中成本泛函的连续时间版本来评估计划的执行情况。设 $L$ 表示一个成本泛函,它可以应用于任何状态 - 动作历史 $(\tilde{x} t, \tilde{u}_t)$,得到:
$L(\tilde{x}_t, \tilde{u}_t) = \int
{0}^{t} l(x(t’), u(t’))dt’ + l_F(x(t))$ (11.55)

其中 $l(x(t’), u(t’))$ 是瞬时成本,$l_F(x(t))$ 是最终成本。

2. 派生信息空间
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值