基于单目视觉的同时定位与地图构建方法综述

最新推荐文章于 2025-03-18 22:25:13 发布

原创

最新推荐文章于 2025-03-18 22:25:13 发布 · 1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#单目视觉SLAM综述

本文探讨了AR中基于单目视觉的SLAM技术，分析了V-SLAM的背景、主流方法和未来趋势。介绍了基于滤波器、关键帧BA和直接跟踪的V-SLAM，强调了鲁棒性和实时性的挑战，以及多传感器融合的重要性。

主要针对增强现实的应用场景。指出AR需要实时定位设备在环境中的方位。定位方案虽然已经有很多种，但多数方案要么在实际应用中存在诸多局限，要么代价太高难以普及。

背景

在AR应用中，由于虚拟物体的叠加目标通常为图像、视频，因此基于图像、视频等视觉信息的V-SLAM方案，对于确保虚实融合效果在几何上保持一致有着天然的优势。

主要针对单目相机的V-SLAM

V-SLAM的目标: 同时恢复出每帧图像对应的相机运动参数C1，…, Cm，及场景三维结构（即世界坐标系下的三维点）x1,…,xn。
将世界坐标系下的三维点变换至具有特定位姿的相机的局部坐标系中，进而投影到图像中。
V-SLAM算法需要将不同图像中对应于相同场景点的图像点匹配起来。
通过优化，得到一组最优的C1，…, Cm和x1,…,xn。使得所有Xj在Ci图像中的投影位置hij与观测到的图像点位置xij尽可能靠近。注意Xj是指世界坐标系下的三维点。Xij是指图像点位置。
由于V-SLAM需要进行图像特征的匹配，因此其稳定性严重依赖与场景特征的丰富程度。加入其它传感器特征可以很大程度上解决这个问题。目前最常用的是结合IMU数据（加速度、角速度）。此时可以引入运动方程。VI-SLAM中需要求解每一时刻的运动速度和IMU数据的偏移量。

国际上主流的V-SLAM方法：基于滤波器、基于关键帧BA、基于直接跟踪的V-SLAM。

基于滤波器的V-SLAM：将每一时刻t的系统状态用一个高斯概率模型表达，其中期望为当前时刻系统状态估计值，协方差矩阵为该估计值误差的协方差矩阵。系统状态由一个滤波器不断更新。代表有MonoSLAM，和MSCKF。其中，

前者使用EKF，后者为了缓解EK

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。