54、概率推理与简单决策：理论与应用解析-优快云博客

本文链接：https://blog.youkuaiyun.com/rust6ferris/article/details/151887338

概率推理与简单决策：理论与应用解析

概率推理在时间维度上的挑战与解决方案

在概率推理的时间维度问题中，初始猜测全部正确的概率极低，例如达到了 (2^{-42})（约 (2×10^{-13})）。这就导致在使用粒子滤波时，哪怕有上千甚至上百万个粒子，也几乎不可能包含一个具有正确污垢地图的粒子。通常，一千个粒子中表现最好的也只能猜对约 32 个，猜错 10 个，并且往往只有一个这样的粒子，或者少数几个。随着时间推移，这些最佳粒子中的一个会主导总似然，粒子群的多样性会消失。之后，由于所有粒子都认同一个单一的、错误的地图，算法就会认定该地图是正确的，并且不再改变。

不过，同时定位与地图构建（SLAM）问题有其特殊结构。在机器人位置序列已知的条件下，各个方格的污垢状态是相互独立的，即：
[P(Dirt_{1,0:t},…,Dirt_{42,0:t} |DirtSensor_{1:t},WallSensor_{1:t},Location_{1:t}) = \prod_{i} P(Dirt_{i,0:t} |DirtSensor_{1:t},Location_{1:t})]

基于此，Rao - Blackwellization 统计技巧就有了用武之地。该技巧基于精确推理总是比采样更准确的简单思想，即便只是针对部分变量。对于 SLAM 问题，我们先对机器人位置进行粒子滤波，然后针对每个粒子，独立地对每个污垢方格进行精确的隐马尔可夫模型（HMM）推理，条件是该粒子中的位置序列。这样，每个粒子就包含一个采样位置以及 42 个方格的 42 个精确边缘后验概率。这种方法被称为 Rao - Blackwellized 粒子滤波器，它能轻松处理确定性污垢的情况，无论是精确的位置感知还是有噪声的墙壁