【视觉惯性SLAM：十五、ORB-SLAM3中的IMU预积分】

KeyPan

于 2025-01-17 20:05:22 发布

阅读量1.8k

点赞数 47

分类专栏：视觉惯性SLAM 文章标签：计算机视觉视觉检测

本文链接：https://blog.youkuaiyun.com/weixin_43086101/article/details/145213733

版权

视觉惯性SLAM 专栏收录该内容

21 篇文章

订阅专栏

15.1视觉惯性紧耦合

15.1.1 视觉惯性紧耦合的重要性

视觉惯性紧耦合（Visual-Inertial Tight Coupling）在 ORB-SLAM3 中的作用不可替代，是实现高鲁棒性和高精度定位的核心技术。单一的视觉 SLAM 主要依赖于图像特征进行定位和建图，这种方法虽然能够在许多环境中获得良好的效果，但其鲁棒性容易受到动态变化、光照条件恶化以及环境特征稀缺等因素的限制。例如，昏暗场景或快速运动可能导致视觉特征丢失，从而引发系统的失败。

IMU 提供的惯性信息包括加速度和角速度，可以很好地弥补视觉信号的短板。在光照恶劣、遮挡严重的情况下，IMU 提供的信息能够维持系统短时间的运动估计，避免系统在特征丢失时的严重漂移。此外，IMU 的高频率输出（通常在 100Hz 到 1000Hz 之间）相比视觉帧率（通常为 30Hz 到 60Hz）更高，这使得 IMU 能够捕捉到快速运动的细节变化，为运动建模提供了连续的信息。

视觉和惯性紧耦合的主要意义在于：

提升系统鲁棒性：通过融合 IMU 数据，即使在纯视觉失效时（例如，黑暗场景或快速旋转），系统仍然可以维持较好的运动估计。
解决尺度模糊问题：视觉 SLAM 的一个主要问题是缺乏对真实尺度的感知，而 IMU 提供的加速度信息可以直接用于计算实际运动的尺度。
平滑运动估计：IMU 的高频率和连续性帮助系统生成更加平滑的轨迹，避免因特征丢失导致的跳变。

视觉与惯性信息的深度融合在 ORB-SLAM3 中是通过紧耦合方式实现的。紧耦合方法将视觉观测和惯性测量统一建模，并在后端优化中联合估计。相比于松耦合方式，紧耦合能够更高效地利用两种信息，提高精度和稳定性。总结而言，视觉惯性紧耦合在无人机导航、机器人移动、自动驾驶等领域是至关重要的技术核心。

15.1.2 视觉惯性紧耦合的意义

视觉惯性紧耦合是将视觉传感器（如摄像头）和惯性传感器（IMU）的数据深度融合的技术，通过在前端和后端联合优化两种传感器的数据，显著提高系统的鲁棒性和精度。以下从技术背景、紧耦合的特点和意义等方面展开说明：

技术背景
在机器人、无人机、增强现实（AR）等领域，单独依赖视觉或惯性传感器可能存在局限性：
- 视觉传感器的不足：在弱纹理环境、快速运动场景、光线变化或完全黑暗下，视觉系统可能失效。
- 惯性传感器的不足：IMU 的漂移和累积误差在长期使用中会严重影响位置和姿态估计的准确性。

紧耦合方法通过将两种传感器的优点结合，克服了各自的局限性。例如，视觉可以校正 IMU 的漂移，IMU 可以提供视觉在运动模糊情况下的初步估计。

紧耦合的核心思想
紧耦合不同于松耦合，它直接在优化框架中联合处理两种传感器的原始数据，而不是简单地将单独估计的结果进行后期融合。紧耦合的流程包括：
- 在前端对视觉特征点和 IMU 数据进行联合建模。
- 在后端优化中同时考虑两种传感器的观测约束，构建联合误差模型。
意义
紧耦合不仅能够提升系统的定位精度，还在动态环境和复杂场景下表现出更高的鲁棒性。特别是在无人机飞行任务中，紧耦合方法显著提高了导航的可靠性。

15.2 IMU 预积分原理及推导

IMU 预积分是一种在视觉惯性 SLAM 中减少计算量、提升效率的关键技术。传统方法需要对每一帧之间的 IMU 数据进行逐点积分，这在高频 IMU 数据下计算代价极高。预积分的核心思想是将两关键帧之间的 IMU 数据整合处理，以生成一个累积的预积分结果。这样做可以避免每次优化中对原始数据的重复计算，大幅提升效率。

IMU 数据本质上是连续的运动信息，包括加速度和角速度。通过对这些数据积分，可以获得位置、速度和姿态的变化。然而，由于测量噪声和离散化误差，直接积分会累积大量的误差。预积分通过以下方式进行改进：

批处理两关键帧之间的数据：在两帧之间，计算位移、速度和姿态的累积变化。
状态转移矩阵的使用：在预积分中，状态转移矩阵描述了系统的动态演化关系。通过矩阵运算，可以精确地表达测量噪声对积分结果的影响。
误差传播模型：预积分中考虑了加速度和角速度噪声的累积效应，利用误差传播公式计算预积分的不确定性。

推导过程中，首先需要建立离散化的惯性导航方程。假设系统的状态包括位置 $p$ 、速度 $v$ 和姿态 $R$ ，则它们的演化关系为：

$p_{k+1} = p_k + v_k \Delta t + \frac{1}{2} R_k a_k \Delta t^2$

$v_{k+1} = v_k + R_k a_k \Delta t$

$R_{k+1} = R_k \cdot \text{Exp}(\omega_k \Delta t)$

其中， $\text{Exp}(\omega_k \Delta t)$ 表示角速度的指数映射，用于更新旋转矩阵。

误差传播公式用来描述噪声对积分结果的影响。假设加速度和角速度的噪声分别为 $n_a$ 和 $n_\omega$ ，则误差方程可以用状态转移矩阵 $\mathbf{F}$ 和噪声输入矩阵 $\mathbf{B}$ 表示：

$\delta \mathbf{x}_{k+1} = \mathbf{F}_k \delta \mathbf{x}_k + \mathbf{B}_k \mathbf{n}_k$

通过累积计算，可以获得两关键帧之间的总误差。

15.2.1 预积分推导涉及的基础公式

IMU 预积分推导涉及经典的惯性导航学理论，其主要目的是通过加速度计和陀螺仪的数据对运动进行积分，从而获得位移和姿态的估计。以下是主要公式和推导的细化内容：

运动方程
惯性导航的核心基于牛顿运动定律和刚体旋转方程：
- 加速度： $\mathbf{a}_b = \mathbf{R}_{wb}^T (\mathbf{a}_w - \mathbf{g}) - \mathbf{b}_a + \mathbf{n}_a$
- 角速度： $\boldsymbol{\omega}_b = \boldsymbol{\omega}_{wb} - \mathbf{b}_g + \mathbf{n}_g$ 其中， $\mathbf{R}_{wb}$ 是世界坐标系到局部坐标系的旋转矩阵， $\mathbf{g}$ 是重力向量， $\mathbf{b}_a$ 和 $\mathbf{b}_g$ 是加速度计和陀螺仪的偏置， $\mathbf{n}_a$ 和 $\mathbf{n}_g$ 是噪声。
积分过程
IMU 的数据通过离散化积分来估计位移和姿态：
- 姿态： $\mathbf{R}_{k+1} = \mathbf{R}_k \cdot \exp([\boldsymbol{\omega}_k \Delta t]_\times)$
- 速度： $\mathbf{v}_{k+1} = \mathbf{v}_k + \mathbf{R}_k \cdot \mathbf{a}_b \Delta t$
- 位置： $\mathbf{p}_{k+1} = \mathbf{p}_k + \mathbf{v}_k \Delta t + \frac{1}{2} \mathbf{R}_k \cdot \mathbf{a}_b \Delta t^2$
预积分的核心公式
通过重新组织上述积分公式，引入预积分量：
- 位置预积分量： $\Delta \mathbf{p}_{ij}$
- 速度预积分量： $\Delta \mathbf{v}_{ij}$
- 旋转预积分量： $\Delta \mathbf{R}_{ij}$

这些预积分量能够脱离具体的时间点，只与初始和结束时刻相关，从而在非线性优化中简化计算。

15.2.2 IMU 模型和运动积分

IMU 模型包括加速度计和陀螺仪。加速度计测量比力，而陀螺仪测量角速度。两者共同为系统提供运动状态信息。运动积分分为以下步骤：

数据采样：采集加速度和角速度数据。
噪声建模：分析并建模传感器噪声，如随机游走和白噪声。
积分算法：选择适当的数值方法（如梯形积分或 Runge-Kutta 方法）对数据进行积分，获取运动状态。

积分时需要特别关注数值误差的累积，并通过误差传播模型进行校正。

15.2.3 为什么需要对 IMU 数据进行预积分

IMU 数据的高频率和高计算需求使得预积分成为必要的优化手段。通过预积分，可以：

减少每次优化中重复计算的开销。
减轻实时系统的计算压力。
提升轨迹估计的精度和鲁棒性。

详细描述：两关键帧之间的积分结果被存储为预积分量，包括位移、速度和姿态的累积变化。这些预积分量直接作为优化过程的输入，避免了实时积分的数值误差。

15.2.4 预积分中的噪声分离

噪声是惯性测量单元（IMU）数据中的重要干扰因素，主要来源于加速度计和陀螺仪的随机误差和偏差。预积分中，噪声分离的主要目的是将 IMU 的测量误差与真实运动信号分离，以提高轨迹估计的准确性。

噪声来源：IMU 的噪声通常可以分为两类：
- 系统偏置：这是加速度计和陀螺仪的慢变化误差，可能由于温度漂移或制造误差引起。偏置是时间相关的，通常需要进行校准。
- 随机噪声：如白噪声或随机游走噪声，这些噪声在短时间内表现为随机性，但在长时间内会导致累积误差。
噪声分离方法：为了从噪声中提取运动信号，通常采用以下步骤：
- 偏置估计：在预积分过程中，通过滑动窗口优化或卡尔曼滤波对偏置进行实时估计。偏置的变化通常被建模为随机游走过程，形式为：
  $\mathbf{b}_{k+1} = \mathbf{b}_k + \mathbf{w}_b$
  其中， $\mathbf{b}$ 是偏置， $\mathbf{w}_b$ 是白噪声。
- 误差传播建模：通过状态转移矩阵描述噪声对系统状态的影响，结合噪声协方差矩阵 $\mathbf{Q}$ 计算噪声在累积中的传播效应。
噪声对轨迹估计的影响：未处理的噪声可能导致轨迹估计出现明显漂移，例如在机器人快速运动中会导致位置和姿态估计错误。因此，噪声分离的准确性直接决定了预积分结果的可靠性。

通过在预积分框架中有效分离噪声，可以显著提高视觉惯性 SLAM 系统的精度和鲁棒性，特别是在动态环境或长时间运行的情况下。

15.2.5 预积分中的误差递推模型

在惯性导航中，误差递推模型是预积分的核心。它的目的是在积分的过程中动态估计误差的传播，从而有效地补偿由于离散化、噪声和模型不准引起的累计误差。

误差递推的基本原理：
- 在惯性导航中，误差主要来源于传感器噪声、偏置误差和离散化误差。
- 误差递推模型通过在状态转移过程中，利用线性化近似将误差传播描述为一个矩阵方程：
  $\delta \mathbf{x}_{k+1} = \mathbf{F}_k \delta \mathbf{x}_k + \mathbf{B}_k \mathbf{n}_k$
  其中， $\mathbf{F}_k$ 是状态转移矩阵， $\mathbf{B}_k$ 是噪声输入矩阵， $\mathbf{n}_k$ 是噪声。
关键矩阵的推导：
- **状态转移矩阵 $\mathbf{F}_k$ **：描述系统在当前状态和下一时刻状态之间的关系。通过泰勒展开对非线性函数进行线性化，推导出矩阵的具体形式。
- **噪声输入矩阵 $\mathbf{B}_k$ **：描述噪声在状态转移过程中的传播方式，通常由系统动态模型推导得出。
误差递推模型的作用：
- 估计当前状态的不确定性，为后端优化提供误差协方差矩阵。
- 在滤波或优化过程中，用于更新系统的状态估计。

通过构建误差递推模型，可以将噪声和误差的影响显式地建模，从而提高系统在不确定环境下的表现。

15.2.6 预积分中零偏误差的影响

零偏误差是 IMU 数据中的一个重要干扰因素，特别是对于加速度计和陀螺仪，它会导致随着时间累积的漂移问题。零偏误差通常表现为传感器输出的系统性偏移，与实际值之间存在偏差。

零偏误差的来源：
- 制造工艺缺陷：传感器在生产过程中可能存在不均匀性，导致零偏误差。
- 环境变化：温度变化和磁场干扰可能会改变传感器的输出。
- 时间漂移：随着时间推移，传感器的零偏误差可能逐渐增大。
零偏误差的影响：
- 加速度计零偏误差：会导致位置估计出现二次积累漂移。例如，误差为 $\, \text{m/s}^2$ 的偏置会在 10 秒内累积为 $\, \text{m}$ 的位置漂移。
- 陀螺仪零偏误差：会导致姿态估计出现线性漂移。例如，误差为 $\, \text{rad/s}$ 的偏置会在 10 秒内累积为 $\, \text{rad}$ 的姿态漂移。
处理零偏误差的方法：
- 预处理校准：在使用 IMU 之前，通过静态数据采集估计零偏误差并进行补偿。
- 实时估计与校正：在预积分框架中，将零偏误差作为状态变量，通过优化或滤波进行估计与更新。
- 多传感器融合：利用视觉传感器或 GPS 数据提供额外的观测，校正由于零偏误差引起的漂移。

通过对零偏误差的建模和实时校正，可以显著减少轨迹估计中的累积漂移，从而提高 SLAM 系统的精度。

15.2.7 预积分中环境动态的适配可比性库

在动态环境下，IMU 数据可能会受到突然的运动变化或外界干扰，这种情况下需要对预积分结果进行适配和修正。可比性库是用于管理不同场景和运动条件下的预积分结果的工具，主要解决预积分结果在不同条件下的可重用性问题。

环境动态的挑战：
- 突发运动：如快速旋转或加速，可能导致积分结果的不连续性。
- 外界干扰：如振动或撞击，可能引入高频噪声。
适配可比性库的功能：
- 存储和管理不同动态条件下的预积分模型。
- 提供在线更新机制，实时适应环境变化。
- 根据当前运动条件选择最佳的预积分参数。
实现方法：
- 构建多场景预积分模型库，涵盖常见动态条件。
- 利用机器学习算法对当前环境进行分类，并从库中选择最匹配的模型。
- 在动态场景中实时调整预积分参数，确保结果的准确性。

15.3 IMU 预积分的代码实现

IMU 预积分的代码实现是视觉惯性 SLAM 系统的核心模块，其开发涉及数据预处理、数学模型实现和优化框架的结合。以下是详细的实现步骤和核心代码结构：

模块划分
IMU 预积分代码通常分为以下几个部分：
- 数据预处理模块：读取和校准 IMU 数据。
- 预积分核心模块：实现位置、速度和姿态的积分计算。
- 噪声建模模块：对噪声协方差进行初始化和传播。
- 优化接口模块：将预积分结果与视觉观测结合，进行全局优化。

关键实现步骤

数据读取与校准：

imu_data = read_imu_data(file_path)
calibrated_data = calibrate(imu_data)

积分计算：

for t in time_steps:
    delta_R = compute_rotation(gyro_data[t])
    delta_v = compute_velocity(accel_data[t], delta_R)
    delta_p = compute_position(delta_v)

噪声传播：

noise_cov = propagate_noise(noise_cov, bias, delta_t)

与优化框架结合：使用开源优化库（如 G2O 或 Ceres Solver）实现全局优化：

optimizer.add_preintegrated_factor(delta_p, delta_v, delta_R, cov_matrix)
optimizer.optimize()

代码示例与测试
为了验证实现的正确性，需要构建模拟数据和真实数据测试。通过调整参数（如噪声标准差、时间步长等）分析系统的鲁棒性和精度。