论文阅读:(二)Kimera: an Open-Source Library for Real-Time Metric-Semantic Localization and Mapping

本文介绍了开源库Kimera,专注于实时度量-语义视觉惯性SLAM,其提供3D网格重建和语义标注功能。Kimera由VIO、RPGO、Mesher和Semantics模块组成,强调高精度、鲁棒性和模块化设计,尤其在VIO和姿态图优化上有所突破。实验评估显示其在状态估计和3D重建方面的优秀性能。

我们常用的SLAM库有ORB-SLAM、VINSMono、OKVIS、ROVIO等。
这篇论文要介绍的是另一个开源库Kimera,它提供了3D网格重建功能和语义标注功能。

(因为还没有什么基础,不能够判别总结,差不多就是整篇翻译)

论文:Kimera: an Open-Source Library for Real-Time Metric-Semantic Localization and Mapping——2020IEEE
源码:https://github.com/MIT-SPARK/Kimera

为实时度量语义视觉惯性SLAM提供了一个开源的C++库,该库支持3D网格重建和语义标注。度量语义理解是一种同时估计场景的3D几何图形并将语义标签附加到对象的能力。
它由四个模块组成:
(1)VIO:用于快速和准确状态估计的视觉惯导测距模块。
(2)RPGO:全局轨迹估计的姿态图优化器
(3)Mesher:快速网格重建的轻型3D网格划分器模块
(4)Semantics:密集的3D度量语义重建模块
这些模块可以单独或组合运行。

相关工作:
SLAM++开创性工作引发了对实时度量语义建图的兴趣激增,这些作品大多数
(1)依赖RGB-D相机
(2)使用GPU处理
(3)使用tracking and mapping架构
(4)使用基于体素、表面或对象表示
比如:SemanticFusion、Fusion++、Mask-fusion。
最近也有基于CPU的处理方法像Voxblox++,但它也依赖于RGB-D相机。
还有一些其他感测模式,像单目相机的CNNSLAM、VSO、VITAMIN-E、XIVO,像激光雷达的SemantiKitti、SegMap。
其中XIVO和Voxblox++最接近最篇论文的提议。XIVO是基于EKF的视觉惯性方法,并产生基于对象的地图。Voxblox++依靠RGB-D传感器和轮式里程计,使用maplab的预建地图来获得视觉惯性姿态估计。
与这些工作不同的是,Kimera

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值