72、决策理论规划与信息空间:从滤波到博弈的深入探索

决策理论规划与信息空间:从滤波到博弈的深入探索

1. 卡尔曼滤波与扩展卡尔曼滤波

卡尔曼滤波在决策理论规划中扮演着重要角色,其表达式 (L_k) 为:
[L_k = \Sigma’ kC_k^T\left(C_k\Sigma’_kC_k^T + H_k\Sigma {\psi}H_k\right)^{-1}]
要得到 (L_{k + 1}),只需将上式中的 (k) 替换为 (k + 1)。在计算 (\mu_{k + 1}) 时,需先计算 (\Sigma’ {k + 1}),因为 (\mu {k + 1}) 的计算依赖于 (L_{k + 1}),而 (L_{k + 1}) 又依赖于 (\Sigma’_{k + 1})。

卡尔曼滤波最常见的用途是通过 (\mu_k) 对状态 (x_k) 进行可靠估计。对于线性高斯(LG)系统,成本泛函为二次型的最优期望成本反馈计划可以用闭式表达式表示,这种模型常被称为线性二次高斯(LQG)模型,它具有线性、二次成本和高斯的特点。最优反馈计划甚至可以直接用 (\mu_k) 表示,而无需 (\Sigma_k)。不过,虽然信息空间(I - space)可简化为状态空间 (X),但相应的 I - 映射并不充分,因为从公式 (11.80) 和 (11.83) 可以看出,计算均值仍需要协方差。因此,最优计划可表示为 (\pi: X \to U),但为使 I - 映射充分,需要在高斯信息空间 (I_{gauss}) 中表示导出的 I - 状态。

卡尔曼滤波为线性高斯模型提供了出色的解决方案,即使在不满足这些条件的实际问题中,扩展卡尔曼滤波也常能成功应用。这是因为概率信息空间可以通过基于二阶矩的近似,用

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值