决策理论规划与信息空间:从滤波到博弈的深入剖析
在决策理论规划的领域中,涉及到多种重要的概念和方法,包括卡尔曼滤波、基于采样的方法以及博弈论中的信息空间等。这些内容对于解决复杂的决策问题具有重要意义。
卡尔曼滤波及其扩展
卡尔曼滤波在处理线性高斯模型时表现出色,其核心公式为:
[L_k = \Sigma_k’C_k^T\left(C_k\Sigma_k’C_k^T + H_k\Sigma_{\psi}H_k\right)^{-1}]
若要得到 (L_{k + 1}),只需将上述公式中的 (k) 替换为 (k + 1)。在计算 (\mu_{k + 1}) 时,需要先计算 (\Sigma_{k + 1}’),因为 (\mu_{k + 1}) 的计算依赖于 (L_{k + 1}),而 (L_{k + 1}) 又依赖于 (\Sigma_{k + 1}’)。
卡尔曼滤波最常见的应用是通过 (\mu_k) 对状态 (x_k) 进行可靠估计。对于线性二次高斯(LQG)系统,其最优期望成本反馈计划可以通过闭式表达式得到。该模型之所以被称为 LQG,是因为它具有线性、二次成本和高斯分布的特点。值得注意的是,最优反馈计划甚至可以直接用 (\mu_k) 表示,而无需 (\Sigma_k)。这表明信息空间(I - space)可以简化为状态空间 (X),但相应的 I - map 并不充分。从公式 (11.80) 和 (11.83) 可以看出,计算均值时仍然需要协方差。因此,最优计划可以表示为 (\pi: X \to U),但为了使 I - map 充分,需要在 (I_{gauss}) 中表示导出的 I - 状态。
在实际应用中,即使问题不满足线性高斯条件,卡尔曼滤
超级会员免费看
订阅专栏 解锁全文
550

被折叠的 条评论
为什么被折叠?



