《视觉SLAM-非线性优化与g2o-高翔》笔记

最新推荐文章于 2025-06-06 01:16:47 发布

原创

最新推荐文章于 2025-06-06 01:16:47 发布 · 750 阅读

7 ·

CC 4.0 BY-SA版权

本文是《视觉SLAM-非线性优化与g2o-高翔》笔记，主要讨论从滤波到优化的转换，介绍了非线性优化思路，目标函数的构建，以及计算梯度的方法。详细讲解了如何计算雅可比矩阵，并探讨了稀疏性在优化中的应用，特别提到了G2O库在图优化中的作用和使用方法。

《视觉SLAM-非线性优化与g2o-高翔》笔记

本文是观看视频《视觉SLAM-非线性优化与g2o-高翔》整理的笔记。

1. 从滤波到优化

1.1 模型

状态变量 $x$ ： $x=[x_1, x_2, ..., x_N, \; y_1, y_2, ..., y_M]$
运动模型 $f$ ： $x_k = f(x_{k-1}, u_k) + v_k$
观测模型 $g$ ： $z_{k,j} = g(x_k,y_j) + n_{k,j}$
其中， $x_i$ 为位姿， $y_i$ 为路标坐标，都是未知量。 $u$ 为运动输入量， $z$ 为观测值，都是测量值。

1.2 传统EKF方法

在工作点附近计算雅可比矩阵（一阶偏导） $F$ 和 $G$ 。
$\frac{\delta f}{\delta x_{k}}|\hat x_{k-1} \qquad v_k \sim N(0, Q_k)\\ G=: \frac{\delta g}{\delta x_k}|\hat x_k \;\qquad n_{k,j} \sim N(0, R_k)$

step1. 预测：估计先验的均值和协方差矩阵
$\breve x_k = f(\hat x_{k-1}, u_k) \qquad \breve P_{k+1} = F_k \hat P_k F_k^T + Q_k$

step2. 更新：计算卡尔曼增益，并用观测模型纠正先验模型，得到后验估计
$K_k = \breve P_k G_k^T (G_k \breve P_k G_k^T + R_k)^{-1} \\ \hat x_k = \breve x_k + K_k (z-\hat z) \qquad \hat P_k = (i - KG_k) \breve P_k$

EKF的问题：
线性化误差，无迭代，噪声非高斯，需要维护一个大的协方差矩阵（平方级别复杂度）。
解决思路=>使用非线性优化

1.3 非线性优化思路

思路	问题
1. 设定目标函数，选定初值状态向量： $x=[x_1, x_2, ..., x_N, y_1, y_2, ..., y_M]$	目标函数是什么？
2. 寻找梯度，使目标函数下降	梯度如何计算？
3. 梯度下降，迭代直到收敛	梯度只是局部下降，如何保证目标函数下降？

1.4 目标函数

在视觉和激光SLAM中，运动模型差别较小，观测模型则有所差异。这里我们以观测模型为例。
观测模型： $z_{k,j} = g(x_k,y_j) + n_{k,j} \qquad n_{k,j} \sim N(0, \Sigma)$
误差分布： $z_{k,j} \sim N(g(x_k,y_j), \Sigma)$

以Bayers方式理解，优化的目标是：在已知观测值 $z$ 的条件下，求能使 $P (x, y ∣ z)$ 概率大最的 $x y$ 。即求：

$(x,y)^*= \underset{x,y}{\arg\max} P(x,y|z)$

根据贝叶斯方程，后验与似然×先验成正比。 $\propto P(z|x,y) P(x,y)$
则有两种方式求解 $x y$ ：

最大似然（MLE）： $(x,y)^*= \underset{x,y}{\arg\max} P(z|x,y)$
最大后验（MAP）： $(x,y)^*= \underset{x,y}{\arg\max} P(z|x,y)P(x,y)$

一般不知道路标的先验位置，所以用MLE多一些。

怎么求MLE呢？
我们会使用负对数简化目标函数。

这么做是因为，高斯分布函数有如下性质：取负对数后，可以分为两部分，前一部分与 $z$ 无关，求极值时可以不考虑；而后一部分的结构比变换之前简单了很多。

$\{ \; \frac{1}{ {(2\pi)}^N det\Sigma} \exp[\frac{1}{2}(x-\mu)^T \Sigma^{-1} (x-\mu) ] \; \} \\ =\frac{1}{2} ln[{(2\pi)}^N det\Sigma] + \frac{1}{2} [(x-\mu)^T \Sigma^{-1} (x-\mu)]$

对变量求极大值，相当于求负对数的极小值。则求下式即可达到最大似然：
$\begin{aligned} \underset{x,y}{\arg\max} P(z|x,y) &= \underset{x,y}{\arg\min} -ln(P(z|x,y)) \\ &= \underset{x,y}{\arg\min} (z-\mu)^T \Sigma^{-1} (z-\mu) \end{aligned}$