SLAM学习笔记——(一)SLAM分类

本文介绍了SLAM(同步定位与地图构建)技术的基本概念及其两大主流实现方式:基于激光雷达的SLAM与基于视觉的SLAM。针对视觉SLAM,文章进一步细分为单目、双目与深度摄像头的应用,并对比了不同方法的优缺点。最后,文中还概述了几种典型的SLAM系统及其应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SLAM( Simultaneous Localization and Mapping)是指同步定位与地图构建。定位和建图两个问题相互依赖,准确的定位依赖于正确的地图,而构建正确的地图又需要准确的定位,这是一个迭代的过程。
目前的SLAM根据硬件设备的不同主要有两种:

1.基于激光雷达的SLAM
基于激光雷达构建场景是古老并且可信的方法,激光雷达也是精确场景使用最多的SLAM传感器。它们提供机器人本体与周围环境障碍物间的距离信息。常见的激光雷达,例如SICK、Velodyne还有我们国产的rplidar等,都可以拿来做SLAM,但总体来说激光雷达的价格都是非常昂贵。激光雷达能以很高精度测出机器人周围障碍点的角度和距离,从而很方便地实现SLAM、避障等功能。
2.基于视觉的SLAM
基于视觉的SLAM主要是通过摄像头采集来的数据进行同步定位与地图构建。相比于激光雷达,摄像头的价格就是要低的多,但有些工业摄像头的价格还是很高的。此外视觉传感器采集的图像信息要比激光雷达得到的信息丰富,所以更加利于后期的处理

这里我们通过下图来比较比较两种方法的区别(数据来源于KITTI):
这里写图片描述

注意:左图为Lidar Odometry and Mapping (激光雷达)
右图为ORB-SLAM2 (视觉)
我们可以观察到对于同一个场景的测试,ORB-SLAM2在后半程出现了明显的误差,这是因为累积漂移(accumulated drift)所引起的,所以对于视觉SLAM要进行回环检测(Loop closure detection)。

由于个人主要是研究Visual SLAM,所以我们接下来对于这个方向进行细分。

(一)
按照视觉传感器主要分为三种:

  1. 单目摄像头(Monocular Camera)

  2. 双目摄像头(Binocular Camera)

  3. 深度摄像头(RGB-D Camera)

深度摄像头可以通过time of flight等方法来直接获得图像及对应的深度信息,优点在于方便获得深度数据,缺点在于成本高,体积大,室外环境基本报废。

双目摄像头可以通过三角方法计算出深度信息,市面上有一些深度摄像头也是直接基于双摄像头来做的。然而双目摄像头在目标距离较远的时候会退化成单目。因此近年来大量的研究都是围绕单目进行的。

单目SLAM可以通过临近图像匹配计算出摄像头位姿的变换,在两个视角上进行三角测距又可以得出对应点的深度信息。通过这样迭代的过程可以实现定位及建图。

(二)
A、根据对图像处理的方式非为:

  1. 直接法(Direct)
  2. 非直接法(Indirect)(一般为基于特征(Feature-Based))

区别如下图:
这里写图片描述

B、根据构建地图的稀疏程度分为:

  1. 稀疏(Sparse)
  2. 稠密(Dense)

但注意:一般这两种方法会同时使用,具体的组合及方法(包含相关论文)如下:

(1)Sparse + Indirect:
monoSLAM:
A. Davison, I. Reid, N. Molton, and O. Stasse. MonoSLAM:
Real-time single camera SLAM. Transactions on Pattern
Analysis and Machine Intelligence (TPAMI), 29, 2007. 2
PTAM:
G. Klein and D. Murray. Parallel tracking and mapping for
small AR workspaces. In International Symposium on Mixed
and Augmented Reality (ISMAR), 2007. 2
ORB-SLAM
R. Mur-Artal, J. Montiel, and J. Tardos. ORB-SLAM: a versatile
and accurate monocular SLAM system. Transactions
on Robotics, 31(5):1147–1163, 2015. 2, 11

(2)Dense + Indirect
L. Valgaerts, A. Bruhn, M. Mainberger, and J. Weickert.
Dense versus sparse approaches for estimating the fundamental
matrix. International Journal of Computer Vision
(IJCV), 96(2):212–234, 2012. 2
R. Ranftl, V. Vineet, Q. Chen, and V. Koltun. Dense monocular
depth estimation in complex dynamic scenes. In International
Conference on Computer Vision and Pattern Recognition
(CVPR), 2016. 2

(3)Dense + Direct:
DTAM
R. Newcombe, S. Lovegrove, and A. Davison. DTAM:
Dense tracking and mapping in real-time. In International
Conference on Computer Vision (ICCV), 2011. 2, 3
J. St¨uhmer, S. Gumhold, and D. Cremers. Real-time dense
geometry from a handheld camera. In Pattern Recognition
(DAGM), 2010. 2, 3
LSD-SLAM
J. Engel, T. Sch¨ops, and D. Cremers. LSD-SLAM: Largescale
direct monocular SLAM. In European Conference on
Computer Vision (ECCV), 2014. 2, 11

(4)Sparse + Direct
DSO
J. Engel, V. Usenko and D. Cremers,
A Photometrically Calibrated Benchmark For Monocular Visual Odometry,
arXiv:1607.02555, July 2016.
J. Engel, V. Koltun and D. Cremers,
Direct Sparse Odometry,
arXiv:1607.02565, July 2016.

### 2D Gaussian Splatting 的概念 2D Gaussian Splatting 是种用于高效表示和渲染三维场景的技术,其核心思想是通过二维高斯分布(2D Gaussians)来近似三维空间中的物体表面[^2]。相比传统的基于体素或网格的方法,2DGS 提供了种更加紧凑且快速的方式来进行场景建模和渲染。 --- ### 2D Gaussian Splatting 的实现方法 #### 数据结构设计 2D Gaussian Splatting 使用的是 **定向椭圆盘** 来作为基本单元,这些单元可以看作是对三维场景的种简化表示形式。每个 2D 高斯分布由以下几个参数定义: - 中心位置 $(\mu_x, \mu_y)$ 表示该高斯分布在图像平面上的位置。 - 协方差矩阵 $\Sigma$ 描述了形状和方向的信息。 - 不透明度 ($\alpha$) 控制可见程度。 - RGB颜色值决定视觉效果。 这种数据结构的设计使得它能够很好地适应现代图形处理硬件的能力,在GPU上执行高效的并行运算成为可能[^4]。 #### 渲染过程优化 在实际渲染过程中,2DGS 利用了精确的光线与椭圆形基元之间的相交测试技术 ("ray-splat intersection") ,从而实现了比传统体积渲染更高的精度以及更低的时间复杂度。具体来说: 1. 对于每条从相机出发到达屏幕像素点的视线(ray),找到与其发生碰撞的所有splat; 2. 计算每个被击中的splat对该特定像素贡献的颜色强度; 3. 将所有相关联的结果按照定规则融合起来形成最终画面输出。 这种方法避免了由于视角变化而导致的传统3D GS可能出现的问题——即当观察角度改变时产生的深度排序不连贯现象。 --- ### 应用场景分析 #### 新视图合成 得益于其强大的表达能力和优秀的性能表现,2D Gaussian Splatting 特别适合应用于虚拟现实(VR)/增强现实(AR)领域内的实时动态环境创建任务之中。例如,在电影制作或者游戏开发当中,可以通过采集少量真实世界的图片资料之后构建完整的沉浸式体验场所。 #### 自动驾驶感知系统改进 另外方面,在自动驾驶汽车所依赖的各种传感器获取的数据基础上运用此算法还可以进步提升对于周围障碍物识别的速度与准确性。因为相较于其他类型的模型而言,采用2D GS方式不仅可以减少存储需求量还能加快推理速度,这对于需要即时响应的安全关键型应用尤为重要[^3]。 #### SLAM 系统升级 同时,在同步定位与地图绘制(SLAM)研究方面也有着广泛的应用前景。借助于2D Gaussian Splatting 技术的优势特性可以帮助机器人更有效地理解其所处的空间布局情况,并据此做出合理的行为决策。 ```python import numpy as np def render_2d_gaussian(center, covariance_matrix, alpha, color): """ Simulates rendering a single 2D Gaussian splat. Parameters: center (tuple): The mean position of the Gaussian distribution on image plane. covariance_matrix (np.ndarray): Covariance matrix defining shape and orientation. alpha (float): Opacity value controlling visibility level. color (list or tuple): RGB values specifying appearance characteristics. Returns: rendered_image (np.ndarray): A synthetic representation showing how this element contributes visually within scene context. """ # Placeholder implementation details omitted here... pass ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值