决策理论规划与信息空间:从滤波到博弈的深入探索
1. 卡尔曼滤波与扩展卡尔曼滤波
卡尔曼滤波在决策理论规划中扮演着重要角色,其表达式 (L_k) 为:
[L_k = \Sigma’ kC_k^T\left(C_k\Sigma’_kC_k^T + H_k\Sigma {\psi}H_k\right)^{-1}]
要得到 (L_{k + 1}),只需将上式中的 (k) 替换为 (k + 1)。在计算 (\mu_{k + 1}) 时,需先计算 (\Sigma’ {k + 1}),因为 (\mu {k + 1}) 的计算依赖于 (L_{k + 1}),而 (L_{k + 1}) 又依赖于 (\Sigma’_{k + 1})。
卡尔曼滤波最常见的用途是通过 (\mu_k) 对状态 (x_k) 进行可靠估计。对于线性高斯(LG)系统,成本泛函为二次型的最优期望成本反馈计划可以用闭式表达式表示,这种模型常被称为线性二次高斯(LQG)模型,它具有线性、二次成本和高斯的特点。最优反馈计划甚至可以直接用 (\mu_k) 表示,而无需 (\Sigma_k)。不过,虽然信息空间(I - space)可简化为状态空间 (X),但相应的 I - 映射并不充分,因为从公式 (11.80) 和 (11.83) 可以看出,计算均值仍需要协方差。因此,最优计划可表示为 (\pi: X \to U),但为使 I - 映射充分,需要在高斯信息空间 (I_{gauss}) 中表示导出的 I - 状态。
卡尔曼滤波为线性高斯模型提供了出色的解决方案,即使在不满足这些条件的实际问题中,扩展卡尔曼滤波也常能成功应用。这是因为概率信息空间可以通过基于二阶矩的近似,用
超级会员免费看
订阅专栏 解锁全文
49

被折叠的 条评论
为什么被折叠?



