视觉SLAM十四讲 第9讲 后端1 贝叶斯法则 式9.5推导
在学习高博的视觉SLAM十四讲第9讲后端1的时候,看到了式9.5,有如下内容:
下面我们来看如何对状态进行估计。按照贝叶斯法则,把 z k z_k zk和 x k x_k xk交换位置,有:
P ( x k ∣ x 0 , u 1 : k , z 1 : k ) ∝ P ( z k ∣ x k ) P ( x k ∣ x 0 , u 1 : k , z 1 : k − 1 ) (9.5) P(x_k|x_0,u_{1:k},z_{1:k})\propto P(z_k|x_k)P(x_k|x_0,u_{1:k},z_{1:k-1})\tag{9.5} P(xk∣x0,u1:k,z1:k)∝P(zk∣xk)P(xk∣x0,u1:k,z1:k−1)(9.5)
读者应该不会感到陌生。这里的第一项称为似然,第二项称为先验。
我最讨厌这种有“易知”、“容易推出”、“即可得”但是又不明白怎么来的的感觉。贝叶斯定理基本的我知道,似然我知道,先验我知道,可是你说交换了位置就直接有了这个式子是怎么来的呢。。。为了解决这种痛苦,请了数理学院的大佬帮忙推导博客主页
关键点在于:
- 式9.5的推导是省略了一些步骤的
- 关键点在于P235页的式9.3。 x k x_k xk和 u , z u,z u,z有关,而 z k z_k zk只和当前时刻的 x k x_k xk有关。意思是说 z k z_k zk和 x 0 , u 1 : k , z 1 : k − 1 x_0,u_{1:k},z_{1:k-1} x0,u1:k,z1:k−1是相互独立的。
- 所以可以根据贝叶斯定理、条件概率公式、相互独立的性质进行推导
基本的公式/性质:
贝叶斯定理
: P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)
条件概率
: P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B) = \frac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB)
相互独立
:若A与B相互独立,则 P ( A ∣ B ) = P ( A ) P(A|B)=P(A) P(A∣B)=P(A)
现在可以开始推导,为了书写的简洁,我们令事件集 ( x 0 , u 1 : k , z 1 : k − 1 ) = B (x_0,u_{1:k},z_{1:k-1})=B (x0,u1:k,z1:k−1)=B:
P ( x k ∣ x 0 , u 1 : k , z 1 : k ) = P ( x k ∣ B , z k ) = P ( x k , B , z k ) P ( B , z k ) = P ( z k ∣ x k , B ) P ( x k , B ) P ( B , z k ) = P ( z k ∣ x k ) P ( x k , B ) P ( B , z k ) = P ( z k ∣ x k ) P ( x k ∣ B ) P ( B ) P ( B ) P ( z k ) = P ( z k ∣ x k ) P ( x k ∣ B ) P ( z k ) = P ( z k ∣ x k ) P ( x k ∣ x 0 , u 1 : k , z 1 : k − 1 ) P ( z k ) \begin{aligned}P(x_k|x_0,u_{1:k},z_{1:k}) &= P(x_k|B,z_k) \\ &= \frac{P(x_k,B,z_k)}{P(B,z_k)} = \frac{P(z_k|x_k,B)P(x_k,B)}{P(B,z_k)} \\ &= \frac{P(z_k|x_k)P(x_k,B)}{P(B,z_k)}\\ &= \frac{P(z_k|x_k)P(x_k|B)P(B)}{P(B)P(z_k)} \\ &= \frac{P(z_k|x_k)P(x_k|B)}{P(z_k)} \\ &= \frac{P(z_k|x_k)P(x_k|x_0,u_{1:k},z_{1:k-1})}{P(z_k)}\end{aligned} P(xk∣x0,u1:k,z1:k)=P(xk∣B,zk)=P(B,zk)P(xk,B,zk)=P(B,zk)P(zk∣xk,B)P(xk,B)=P(B,zk)P(zk∣xk)P(xk,B)=P(B)P(zk)P(zk∣xk)P(xk∣B)P(B)=P(zk)P(zk∣xk)P(xk∣B)=P(zk)P(zk∣xk)P(xk∣x0,u1:k,z1:k−1)
式子推导过程中应用到了贝叶斯定理
、条件概率
和事件相互独立
的性质,最后把 P ( z k ) P(z_k) P(zk)略去,把等于号变成正比于符号,便有:
P ( x k ∣ x 0 , u 1 : k , z 1 : k ) ∝ P ( z k ∣ x k ) P ( x k ∣ x 0 , u 1 : k , z 1 : k − 1 ) P(x_k|x_0,u_{1:k},z_{1:k}) \propto P(z_k|x_k)P(x_k|x_0,u_{1:k},z_{1:k-1}) P(xk∣x0,u1:k,z1:k)∝P(zk∣xk)P(xk∣x0,u1:k,z1:k−1)
敲公式不易,点个赞再走吧~~~
如果大佬觉得有什么更好的推导或者理解思路,欢迎留言一起讨论~~