传感器与信息空间:连续状态下的信息处理
1. 历史信息状态与空间
将 $\tilde{u}_t$ 和 $\tilde{y}_t$ 与初始条件 $\eta_0$ 相结合,可得到时间 $t$ 时的历史信息状态:
$\eta_t = (\eta_0, \tilde{u}_t, \tilde{y}_t)$ (11.53)
时间 $t$ 时的历史信息空间是所有可能的 $\eta_t$ 的集合,记为 $I_t$。需要注意的是,$I_t$ 是一个函数空间,因为每个 $\eta_t \in I_t$ 都是时间的函数。在离散阶段的情况下,每个 $I_k$ 会使用(11.18)或(11.19)组合成一个单一的历史信息空间 $I_{hist}$。连续时间的类似情况可表示为:
$I_{hist} = \bigcup_{t\in T} I_t$ (11.54)
这是一个不规则的函数集合,因为它们具有不同的定义域;这种不规则性在离散阶段的情况中也会出现,其中 $I_{hist}$ 由不同长度的序列组成。
可以给出公式 11.1 中成本泛函的连续时间版本来评估计划的执行情况。设 $L$ 表示一个成本泛函,它可以应用于任何状态 - 动作历史 $(\tilde{x} t, \tilde{u}_t)$,得到:
$L(\tilde{x}_t, \tilde{u}_t) = \int {0}^{t} l(x(t’), u(t’))dt’ + l_F(x(t))$ (11.55)
其中 $l(x(t’), u(t’))$ 是瞬时成本,$l_F(x(t))$ 是最终成本。
超级会员免费看
订阅专栏 解锁全文
25

被折叠的 条评论
为什么被折叠?



