史上最全的动态环境下SLAM论文汇总!(值得收藏)

本文汇总了动态环境中的SLAM(同时定位与建图)研究,包括相关调查论文、文章、中文工作及动态对象检测与跟踪的研究。涉及DynaSLAM、DS-SLAM等系统,探讨了语义分割、目标检测和几何方法在动态SLAM中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

动态环境SLAM是目前slam方向的一个热门研究领域。

Related survey papers:

Related Article:

中文工作汇总

  • 1.DynaSLAM(IROS 2018)

    • 论文:DynaSLAM: Tracking, Mapping and Inpainting in Dynamic Scenes
      代码:https://github.com/BertaBescos/DynaSLAM
      主要思想:(语义+几何)
      1.使用Mask-CNN进行语义分割;
      2.在low-cost Tracking阶段将动态区域(人)剔除,得到初始位姿;
      3.多视图几何方法判断外点,通过区域增长法生成动态区域;
      4.代码中将多视图几何的动态区域与语义分割人的区域全都去除,将mask传给orbslam进行跟踪;
      5.背景修复,包括RGB图和深度图。
      创新点: 语义分割无法识别移动的椅子,需要多视图几何的方法进行补充
      讨论: DynaSLAM与下面的DS-SLAM是经典的动态slam系统,代码实现都很简洁。Dyna-SLAM的缺点在于:1.多视图几何方法得到的外点,在深度图上通过区域增长得到动态区域,只要物体上存在一个动态点,整个物体都会被“增长”成为动态 2.其将人的区域以及多视图几何方法得到的区域都直接去掉,与论文不符。

  • 2.DS-SLAM(IROS 2018, 清华大学)

    • 论文:DS-SLAM: A Semantic Visual SLAM towards Dynamic Environments

代码:https://github.com/ivipsourcecode/DS-SLAM
主要思想:(语义+几何)
1.SegNet进行语义分割(单独一个线程);
2.对于前后两帧图像,通过极线几何检测外点;
3.如果某一物体外点数量过多,则认为是动态,剔除;
4.建立了语义八叉树地图。
讨论:这种四线程的结构以及极线约束的外点检测方法得到了很多论文的采纳,其缺点在于:1.极线约束的外点检测方法并不能找到所有外点,当物体沿极线方向运动时这种方法会失效 2.用特征点中的外点的比例来判断该物体是否运动,这用方法存在局限性,特征点的数量受物体纹理的影响较大 3.SegNet是2016年剔除的语义分割网络,分割效果有很大提升空间,实验效果不如Dyna-SLAM

  • 3.Detect-SLAM(2018 IEEE WCACV, 北京大学)

论文:Detect-SLAM: Making Object Detection and SLAM Mutually Beneficial
代码:https://github.com/liadbiz/detect-slam
主要思想:
目标检测的网络并不能实时运行,所以只在关键帧中进行目标检测,然后通过特征点的传播将其结果传播到普通帧中
1.只在关键帧中用SSD网络进行目标检测(得到的是矩形区域及其置信度),图割法剔除背景,得到更加精细的动态区域;
2.在普通帧中,利用feature matching + matching point expansion两种机制,对每个特征点动态概率传播,至此得到每个特征点的动态概率;
3.object map帮助提取候选区域。

  • 4.VDO-SLAM(arXiv 2020)

论文:VDO-SLAM: A Visual Dynamic Object-aware SLAM System
代码: https://github.com/halajun/vdo_slam
主要思想:
1.运动物体跟踪,比较全的slam+运动跟踪的系统;
2.光流+语义分割。

  • 5.Co-Fusion(ICRA 2017)

论文:Co-Fusion: Real-time Segmentation, Tracking and Fusion of Multiple Objects
代码:https://github.com/martinruenz/co-fusion
主要思想: 学习和维护每个物体的3D模型,并通过随时间的融合提高模型结果。这是一个经典的系统,很多论文都拿它进行对比

  • 6.Learning Rigidity in Dynamic Scenes with a Moving Camera for 3D Motion Field Estimation(2018,ECCV,NVIDIA)

论文:Learning Rigidity in Dynamic Scenes with a Moving Camera for 3D Motion Field Estimation
代码:https://github.com/NVlabs/learningrigidity.git
主要思想:
1.RTN网络用于计算位姿以及刚体区域,PWC网络用于计算稠密光流;
2.基于以上结果,估计刚体区域的相对位姿;
3.计算刚体的3D场景流;
此外还开发了一套用于生成半人工动态场景的工具REFRESH。

  • 7.ReFusion(2019 IROS)

论文:ReFusion: 3D Reconstruction in Dynamic Environments for RGB-D Cameras Exploiting Residuals

代码:https://github.com/PRBonn/refusion
主要思想:
主流的动态slam方法需要用神经网络进行分实例分割,此过程需要预先定义可能动态的对象并在数据集上进行大量的训练,使用场景受到很大的限制。而ReFusion则使用纯几何的方法分割动态区域,具体的:在KinectFusion稠密slam系统的基础上,计算每个像素点的残差,通过自适应阈值分割得到大致动态区域,形态学处理得到最终动态区域,与此同时,可得到静态背景的TSDF地图。
讨论:为数不多的不使用神经网络的动态slam系统

  • 8.RGB_D-SLAM-with-SWIAICP(2017)

论文:RGB-D SLAM in Dynamic Environments Using Static Point Weighting
代码:https://github.com/VitoLing/RGB_D-SLAM-with-SWIAICP
主要思想:
1.仅使用前景的边缘点进行跟踪( Foreground Depth Edge Extraction);
2.每隔n帧插入关键帧,通过当前帧与关键帧计算位姿;
3.通过投影误差计算每个点云的静态-动态质量,为下面的IAICP提供每个点云的权重;
4.提出了融合灰度信息的ICP算法–IAICP,用于计算帧与帧之间的位姿。
讨论: 前景物体的边缘点能够很好地表征整个物体,实验效果令人耳目一新。但是文中所用的ICP算法这并不是边缘slam常用的算法,边缘slam一般使用距离变换(DT)描述边缘点的误差,其可以避免点与点之间的匹配。论文Robust RGB-D visual odometry based on edges and points提出了一种很有意思的方案,用特征点计算位姿,用边缘点描述动态区域,很好地汲取了二者的优势。

  • 9.RDS-SLAM(2021,Access)

论文:RDS-SLAM: Real-Time Dynamic SLAM Using Semantic Segmentation Methods
代码:https://github.com/yubaoliu/RDS-SLAM.git
主要思想:克服不能实时进行语义分割的问题
1.选择最近的关键帧进行语义分割;
2.基于贝叶斯的概率传播;
3.通过上一帧和局部地图得到当前帧的外点;
4.根据运动概率加权计算位姿。

  • 靠谱的工作
    • DS-SLAM Dynaslam:https://github.com/zhuhu00/DS-SLAM_modify; https://blog.youkuaiyun.com/qq_41623632/article/details/112911046;

Dynamic Object Detection and Removal

Dynamic Object Detection and Tracking

Researchers

🥼1. Berta Bescos

主页:谷歌学术 | 个人主页 | GitHub

博士学位论文: Visual slam in dynamic environments

代表性工作

🥼2. Yubao Liu

Walk Into AI World

主页:谷歌学术 | GitHub

代表性工作:

  1. RDS-SLAM: real-time dynamic SLAM using semantic segmentation methods
  2. KMOP-vSLAM: Dynamic Visual SLAM for RGB-D Cameras using K-means and OpenPose
  3. RDMO-SLAM: Real-time Visual SLAM for Dynamic Environments using Semantic Label Prediction with Optical Flow
3. Guoquan Huang(SLAMMOT)
4. Shenshao Jie(MOT)
### 动态环境下的SLAM技术相关论文 动态环境中的SLAM(Simultaneous Localization and Mapping)是一个活跃的研究领域,主要关注如何在环境中存在运动目标的情况下实现鲁棒的定位和地图构建。以下是几篇重要的相关论文及其核心贡献: #### 1. **DOT: Dynamic Object Tracking for Visual SLAM** 该论文提出了一种名为 DOT 的框架,用于处理视觉 SLAM 中的动态对象[^1]。它通过结合语义信息和几何约束来区分静态场景和动态对象,并实时跟踪这些动态对象的位置。这种方法不仅提高了 SLAM 系统在复杂动态环境中的性能,还能够提供额外的对象级理解。 #### 2. **DynaSLAM: Tracking, Mapping and Inpainting in Dynamic Scenes** DynaSLAM 是一种针对动态场景设计的 SLAM 方法[^2]。它的创新之处在于利用 Mask-CNN 进行语义分割以检测动态对象,并采用多视图几何方法进一步优化动态区域的估计。此外,DynaSLAM 提供了一个背景修复模块,能够在移除动态对象后重建完整的 RGB 和深度图像。尽管其算法简单高效,但在某些情况下可能会过度扩展动态区域,从而影响系统的精度。 #### 3. **DS-SLAM: A Semantic-aware System for LiDAR-Inertial Odometry with Dynamic Objects Removal** 虽然未直接提及于引用中,但 DS-SLAM 是另一个值得关注的工作。它专注于激光雷达惯性里程计 (LiDAR-Inertial Odometry),并引入了语义感知机制以排除动态障碍物的影响。通过对点云数据进行分类,DS-SLAM 能够有效过滤掉由行人或其他移动车辆引起的干扰[^4]。 #### 4. **Dynamic Bundle Adjustment for Real-Time Monocular SLAM in Dynamic Environments** 这篇论文探讨了如何改进传统的束调整 (Bundle Adjustment) 技术以便适应动态条件下的单目相机输入[^5]。作者提出了一个新的能量函数模型,允许系统同时考虑静态特征点和动态特征点之间的关系,从而使轨迹估算更加精确可靠。 #### 5. **Real-time visual odometry from dense RGB-D images** 此研究展示了基于密集 RGB-D 图像计算稠密光流场的技术路径[^3]。对于含有大量遮挡或者快速变化的目标而言,这种方案可以显著提升姿态估计稳定性。然而需要注意的是,由于依赖高分辨率传感器读数,因此可能面临较高的计算成本挑战。 ```python import numpy as np def dynamic_object_filter(point_clouds): """ Filter out moving objects using semantic segmentation. Args: point_clouds (np.ndarray): Input point cloud data. Returns: filtered_points (np.ndarray): Point clouds without moving objects. """ # Placeholder function demonstrating filtering logic mask = detect_moving_objects(point_clouds) filtered_points = point_clouds[np.logical_not(mask)] return filtered_points def detect_moving_objects(data): """Detect whether each point belongs to a moving object.""" pass # Implementation details omitted here ``` 上述代码片段展示了一个简单的伪代码例子,说明如何应用语义分割掩码去除了来自原始点云中的动态部分。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值