VINS-Mono学习（三）——基于滑动窗口的VIO紧耦合后端非线性优化

本文链接：https://blog.youkuaiyun.com/qq_38167930/article/details/119758279

本文详细介绍了VINS-Mono视觉惯性里程计（VIO）的后端优化过程，特别是基于滑动窗口的非线性优化。主要内容包括视觉重投影误差、IMU预积分误差以及边缘化（Marginalization）的先验残差。文章讨论了逆深度参数化在视觉误差中的作用，IMU预积分模型的构建，以及边缘化操作如何形成先验，保持系统优化的稀疏性。通过舒尔补分解，展示了如何快速求解矩阵并应用于多元高斯分布，以及如何在滑动窗口中有效地管理和更新信息矩阵。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

初始化后，采用基于滑动窗口的紧耦合单目VIO进行状态估计。首先来看VINS-Mono后端的整体思路：

大道至简，思路比较简单，但是实现相当复杂。回顾BA三要素：误差项、优化变量、协方差。

简单说，VINS-Mono的误差来源于三部分，分别是来源于视觉的重投影误差，来源于IMU预积分的IMU误差（PVBQ的运动误差）以及来源于滑动窗口维护的边缘化操作带来的先验误差。

BA优化模型分为三部分：

1、Marg边缘化残差部分（滑动窗口中去掉位姿和特征点约束）；

2、IMU残差部分（滑动窗口中相邻的IMU产生）；

3、视觉代价误差函数部分（滑动窗口中特征点在相机下视觉重投影误差）。

其中，知识点涉及最多的是边缘化部分，理论比较多，放到最后讲，先记录一下视觉约束和IMU约束，如下：

0、系统需要优化的状态量

在正式介绍视觉约束之前，首先需要考虑的是，为了节约计算量，VINS采用滑动窗口形式的Bundle Adjustment，进行局部BA优化。举个例子来说，在i时刻，滑动窗口内的待优化的系统状态量定义如下：

其中：

$x_{i}$ 包含i时刻IMU机体在惯性坐标系中的位置，速度，姿态以及IMU机体坐标系中的加速度和角速度的偏置量估计（IMU状态：PVQ、加速度bias、陀螺仪bias）、m+1个路标点、IMU到Camera的外参数；
n，m分别是机体状态量，路标在滑动窗口里的起始时刻；
N滑动窗口中关键帧数量；
M是被滑动窗口内所有数量帧观测到的路标数量。