Main Idea
利用RGB图进行2D detection,然后取出2D detection框柱的视锥中的3D点。在视锥中接上segmentation网络对视锥进行object mask。取出mask出的object点云,接上T(ranslation)-Net对object点云中心进行微调,然后接上Box-Net对Box的center,height,width,length,heading angle进行回归。
implement
- tensorflow
- pointnet框架
- pointnet++框架
Trick:
- 因为数据集是马路场景,所以一共就3种目标:pedestrian,car,cyclist,他们的size都有一个差不多的值。
- heading angle是一个角度,范围为0∘{0^ \circ }0∘~360∘{360^ \circ }