1.问题
在纯视觉SLAM中存在尺度不确定的问题,而在视觉和IMU融合系统中很好的解决了这一问题。一直困扰我的是如何去理解SLAM中的尺度?尺度到底代表了什么?查阅了大量资料都没有一个明确的尺度定义,于是我开始从系统的整体,它可能会扮演的作用去猜测它,下面是我关于尺度通俗的理解:
2.尺度可以理解为深度或者说是两帧之间的位姿(R,t)以及深度等的信息。
3.理解
相机初始化的过程就是位姿和深度信息求解的过程。为什么说纯视觉SLAM存在尺度不确定问题?拿单目相机来说,使用2D-2D的方式来估计两帧相机,主要求解方法是基础矩阵,单应性矩阵以及BA等方式。但是在纯旋转情况下,也可以说是在平移t比较小的情况下基础矩阵的解算是失效的,通过单应性矩阵和BA的求解方式可以解析出旋转,但此时的求解出的平移是不可靠的。因此,也无法使用三角测距的方法来恢复地图点的深度。也就是,当只有在t足够大时,才能被解析,才能通过对极几何的方式恢复地图点的深度。
4.尺度确定
地图点的深度是和平移相关的,一个深度对应一个平移。为了能够检测出足够大的平移运动,在VIO系统中我们需要初始化过程,解析出t以及地图点的深度,并确定尺度。
本文探讨了纯视觉SLAM中尺度不确定性的概念,解释了尺度在SLAM系统中代表深度和位姿信息。作者指出,单目相机通过2D-2D匹配在小平移情况下无法可靠估计深度,而视觉IMU融合能有效解决这一问题。在VIO系统中,通过初始化过程可以确定尺度和深度,从而确保地图点的精确重建。
2万+

被折叠的 条评论
为什么被折叠?



