一文教你读懂3D目标检测

PaQiuQiu

已于 2023-07-16 11:46:13 修改

阅读量2.1w

点赞数 65

CC 4.0 BY-SA版权

分类专栏： 3D，从无知到无畏文章标签： 3d 目标检测计算机视觉

于 2019-05-06 15:57:54 首次发布

本文链接：https://blog.youkuaiyun.com/lxy_2011/article/details/89884828

3D，从无知到无畏专栏收录该内容

62 篇文章 ¥89.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了3D目标检测的重要性，特别是在自动驾驶和机器人领域的应用。对比2D目标检测，3D检测能提供物体的三维尺寸和旋转信息。目前主流方法包括激光、单目相机和激光+单目相机的融合。文章探讨了3D目标检测的难点，如遮挡、截断等问题，并概述了几种主要方法，如SSD-6D和3D Bounding Box Estimation。此外，还提出了未来可能的研究方向，如引入深度信息和几何约束。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文共4593字，预计需要20分钟，可以先收藏再看哦

1 简介

目标检测是计算机视觉领域的传统任务，与图像识别不同，目标检测不仅需要识别出图像上存在的物体，给出对应的类别，还需要将该物体的位置通过最小包围框（Bounding box）的方式给出。根据目标检测需要输出结果的不同，一般将使用RGB图像进行目标检测，输出物体类别和在图像上的最小包围框的方式称为2D目标检测，而将使用RGB图像、RGB-D深度图像和激光点云，输出物体类别及在三维空间中的长宽高、旋转角等信息的检测称为3D目标检测。

随着Faster-RCNN的出现，2D目标检测达到了空前的繁荣，各种新的方法不断涌现，百家争鸣，但是在无人驾驶、机器人、增强现实的应用场景下，普通2D检测并不能提供感知环境所需要的全部信息，2D检测仅能提供目标物体在二维图片中的位置和对应类别的置信度，但是在真实的三维世界中，物体都是有三维形状的，大部分应用都需要有目标物体的长宽高还有偏转角等信息。例如下图Fig.1中，在自动驾驶场景下，需要从图像中提供目标物体三维大小及旋转角度等指标，在鸟瞰投影的信息对于后续自动驾驶场景中的路径规划和控制具有至关重要的作用。