0. 摘要
该论文主要是提出AVOD(Aggregate View Object Detection)网络,多视角聚合数据实现无人驾驶场景下3D物体实时检测的网络。avod网络以由雷达点云数据生成的BEV map和RGB图像作为输入,特征提取并融合后经过子网络region proposal network(RPN)产生non-oriented region proposals,得到proposals对应的类别(object/background)和第一次regress得到的3D bounding box,将这些proposals送入子网络second stage detector network产生精确的有方向的3D bounding boxs,完成3D物体的定位与识别。网络结构如下图。
1. 写在前面
该篇论文和mv3d一样都是多视角融合实现3D object detection。mv3d网络在小目标物体检测上表现不佳,本文弥补了这个不足,表现出更好的精度和速度。
2. 结构记录
A. BEV Feature Map Generation
- 从点云数据生成6-channel BEV map。
- 与mv3d类似,分辨率为0.1m,只选择范围[-40, 40]×[0, 70]×[0, 2.5]范围内点云。