【那些年我们一起看过的论文】之《MonoSLAM: Real-Time Single Camera SLAM》-优快云博客

本文链接：https://blog.youkuaiyun.com/zijinxuxu/article/details/67080134

本文介绍了MonoSLAM算法，这是一种能够实时重建未知场景中单目摄像头3D运动轨迹的方法。该算法重点在于使用概率框架在线创建稀疏而持久的自然地标，实现了仅依赖单目相机的跟踪与映射。通过主动映射和测量策略，通用运动模型以及特征初始化和方向估计， MonoSLAM在普通PC上可实现30Hz的高效运行。该工作扩展了机器人系统的应用，并为SLAM在增强现实等领域开启了可能。尽管在无特征区域可能会丢失追踪，但MonoSLAM的贡献在于证明了单目相机进行地图构建和定位的可行性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

/*
MonoSLAM其实只是指SLAM中使用的相机是单目的而已，感觉应该写在PTAM之前作为一种方法可行性探究的展现。没错，它的最主要意义在于证明了只使用单目相机作为唯一输入端也是可以完成tracking与mapping的工作的。
*/
本文设计了一种可以实时复现在未知场景里随机运动的单目摄像头的3D运动轨迹的算法。这个方法的核心是在一个概率框架内实时在线地创建一些稀疏但持久的自然地标。
Our key novel contributions include an active approach to mapping and measurement, the use of a general motion model for smooth camera movement, and solutions for monocular feature initialization and feature orientation estimation.(关键贡献点包括一种映射和测量的积极的方式，一种为摄像头平滑运动设计的通用移动模型的使用，以及单目特征初始化和特征方向估计的解决方案。)

综合以上，我们设计了非常有效和鲁棒的算法，在普通PC和摄像头可以运行到30HZ。这些工作扩展了robotic系统的范围，也开辟了SLAM在其中应用的大门。最后我们把MonoSLAM应用于高性能全自由度的仿人机器人和人手持摄像头的增强现实中。

They use the vision camera rather than a laser or sensar.
Require high frame rate performance like 30Hz.

将会建立一个较为稀疏的地图，因为定位（知道自己的在哪里）比构建完整地图重要的多。将会重复定位，利用相机的位姿来确认环路闭合。

我们的主要贡献是：证明单目相机作为唯一输入来建立地图和定位是可行的！虽然是通过高帧输入得到一个稀疏的地图。(Our approach here is the first which can achieve convincing real time and drift-free AR as t