Multi-View 3D Object Detection Network for Autonomous Driving
paper:https://arxiv.org/abs/1611.07759
github:https://github.com/bostondiditeam/MV3D.git
简介
LIDAR 传感器的优势在于深度信息,摄像头的优势在于语义信息,MV3D提出一种融合 RGB 和 Point Cloud
的3D目标检测框架。 同时,和以往基于voxel的方法不同,它只用了点云的俯视图和前视图,这样既能减少计算量,又不至于损失过多的信息。随后生成3D候选区域,把特征和候选区域融合后输出最终的目标检测框。
网络框架
MV3D架构由两部分组成:3D候选网络 + 融合网络。
- 3D候选网络:利用点云的鸟瞰图表示来生成3D候选框。3D目标候选的好处是可以将其