自动驾驶中的 3D 目标检测方法综述
在自动驾驶领域,3D 目标检测是至关重要的一环,它能够帮助车辆准确感知周围环境中的物体,从而做出合理的决策。目前,主要的 3D 目标检测方法可以分为基于相机、基于激光雷达(LiDAR)和基于雷达(RADAR)的方法,下面我们来详细了解一下。
基于相机的方法
基于相机的 3D 目标检测方法主要分为结果提升方法和特征提升方法。
结果提升方法
结果提升方法通过预测物体的角点、2D 左右框和关键点来进行 3D 目标检测。例如,KM3D 使用 center - net 基线预测图像中每个物体的 9 个关键点的投影,并通过最小化关键点预测和实例预测之间的投影误差来预测深度;MonoFlex 则专注于仅使用物体的 3D 高度和视觉高度来预测深度,充分利用自动驾驶场景的知识。
此外,还有一些方法通过挖掘图像中隐含的信息来提高深度预测的准确性,即深度先验方法。几何投影是一种从 2D 图像中检测 3D 物体的技术,它利用物体的高度来估计深度,并将其作为数学先验融入深度学习模型。M3D - RPN、GAC 和 YoloStereo3D 从训练数据集中收集深度先验来帮助定义每个锚点。然而,投影过程可能会导致误差放大,影响深度推断的控制和训练效率。为了解决这个问题,GUPNet 引入了几何不确定性投影方法,提出 GUP 模块来获取推断深度的几何引导不确定性,并采用不确定性理论在概率框架下对投影过程进行建模。
特征提升方法
特征提升方法将中间特征转换为世界坐标,并在鸟瞰图(BEV)或 3D 体积中产生最终预测。这类方法又可进一步分为伪激光雷达方法和特征映射方法。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



