paper:https://arxiv.org/pdf/1712.02294
github:https://github.com/kujason/avod
简介
AVOD(Aggregate View Object Detection)算是MV3D的改进版。AVOD的3D目标检测框架,主要解决自动驾驶场景中从多模态数据(如激光雷达和相机图像)联合生成3D候选框(proposal)并检测物体的任务。
AVOD核心思想
- 提出的一种使用LIDAR点云和RGB图像特征融合的二阶段网络:区域建议网络(RPN)和二级检测器网络;
- RPN网络使用能够在高分辨率特征图上执行多模态特征融合,为道路场景中的多个目标类生成可靠的3D目标候选;
- 利用这些proposals,二阶段检测网络执行精确的面向3Dbbox回归和类别分类,以预测三维空间中物体的范围、方向和分类。