贝叶斯推理以及贝叶斯滤波算法推导

平山村小明

已于 2023-12-31 22:51:10 修改

阅读量507

点赞数 1

文章标签：算法机器学习概率论

于 2023-11-16 03:55:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_46187561/article/details/134432765

版权

贝叶斯推理以及贝叶斯滤波算法推导

最近重新翻了下《probability robotics》中对贝叶斯的数学推导和应用，恍然发现其大道至简，以及在卡尔曼滤波器，粒子滤波器等等的体现，以下给出相应的整理和理解以共分享和记录：

贝叶斯准则（Bayes rule）:

$=\eta p(y|x)p(x)$
其实这里是由两次条件概率公式推出的：
$p (x, y) = p (x ∣ y) p (y) = p (y ∣ x) p (x)$
所以这里的 $\eta$ 其实也就是 $p (y)$ ，因为这里很多时候是一个常数，所以也称作归一化常数。贝叶斯准则说明了一个什么道理呢？就是：
$后验概率=先验概率\times 似然概率$
先验概率由以往的经验给出，似然概率又当前模型给出，贝叶斯准则简短的一行公式提供了很多工程应用指导。

贝叶斯滤波器

接下来将基于贝叶斯准则推理其应用，也就是贝叶斯滤波器：

首先定义表示：
$t时刻的状态量：x_t \\ t时刻的观测量：z_t \\ t时刻的控制量：u_t \\ t时刻的转移概率：p(x_t|x_{t-1},u_t) \\ t时刻的观测概率：p(z_t|x_t) \\ t时刻的置信度：bel(x_t) = p(x_t|z_{1:t},u_{1:t}) \\ 基于t时刻以前的置信度: \overline{bel}(x_t) = p(x_t|z_{1:t-1},u_{1:t})$
同时给出假设：
- 状态 $x_t$ 是完整的
- 马尔可夫性质
  给出贝叶斯滤波算法，其实主要就是迭代两行公式：

$Bayes filter(bel(x_{t-1}), u_t, z_t):$
for all $x_t$ do
$\quad \overline{bel}(x_t) = \int p(x_t|u_t,x_{t-1})bel(x_{t-1})dx_{t-1}$
$\quad bel(x_t) = \eta p(z_t|x_t)\overline{bel}(x_t)$
end
return $bel(x_t)$

具体来说就是系统给出了一个机器人系统上一时刻的置信度和限制的控制量和观测量，第一步预测现在的置信度也就是先验的部分，而第二部分更新结合了测量结果得到当前的后验概率。

数学推导：
同样两次条件概率公式：
$p(x_t,z_t|z_{1:t-1},u_{1:t}) = p(x_t|z_{1:t},u_{1:t})p(z_t|z_{1:t-1},u_{1:t}) \\ \quad\quad\quad\quad\quad\quad\quad\quad =p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1}u_{1:t})$
所以有了： $p(x_t|z_{1:t},u_{1:t}) =\frac{p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1}u_{1:t})}{p(z_t|z_{1:t-1},u_{1:t})} \\ =\eta p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1}u_{1:t})$
由于之前的假设，x状态是完整的，所以我们可以有： $p(z_t|x_t,z_{1:t-1},u_{1:t}) = p(z_t|x_t)$ 。
所以简化为：
$p(x_t|z_{1:t},u_{1:t}) = \eta p(z_t|x_t)p(x_t|z_{1:t-1}u_{1:t}) \\ 即: bel(x_t) = \eta p(z_t|x_t)\overline{bel}(x_t)$
那么 $\overline{bel}(x_t)$ 怎么由已知条件得到呢？由全概率公式推广： $\overline{bel}(x_t) = p(x_t|z_{1:t-1}u_{1:t})=\int p(x_t|x_{t-1},z_{1:t-1},u_{1:t})p(x_{t-1}|z_{1:t-1}u_{1:t})dx_{t-1}$
又一次因为知道 $x_{t-1}$ 的完整状态，有： $p(x_t|x_{t-1},z_{1:t-1},u_{1:t})=p(x_t|x_{t-1},u_t)$ ,同时后一项也可以安全的省掉 $u_t$ 对 $x_{t-1}的估计$ ，所以有了：
$\overline{bel}(x_t)=\int p(x_t|x_{t-1},u_t)p(x_{t-1}|z_{1:t-1},u_{1:t-1})dx_{t-1} \\ = \int p(x_t|x_{t-1},u_t) bel(x-1) dx_{t-1}$
也就是当前时刻的状态置信度由上一时刻的置信度以及状态转移概率给出。值得一提的是，还需要知道初始的置信度，这样便可以不断迭代。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。