一、前言
PVRCNN是2019年12月发布的一篇3d目标检测的文章,代码已经在2021年4月开源。
传统的目标检测网络一般是基于 3d voxel 或者基于 pointnet 的方式,而PVRCNN,它结合了基于 point 和基于 voxel 这两种方式,从而提高了三维检测性能。PV-RCNN的原理在于,基于 voexl 的操作可以有效地对多尺度特征表示进行编码,并可以生成高质量的3D proposals,而基于PointNet的 SA 操作可以通过灵活的感受野保留准确的位置信息。
论文里对网络结构和性能介绍的很详细,想要全篇了解的可以去读一下 这篇论文翻译:PV-RCNN论文翻译
这里主要对 PV-RCNN中的 RoI-grid Pooling 模块进行详细的说明。(如果对该网络其它的模块也不是很清楚的可以留言,后需会同步更新出来)
二、RoI-grid pooling module流程图及说明
图中:
蓝色块表示一个 tensor 张量;
箭头上面的方框表示某种方法;
绿色块表示 一个子网络;
橙色块表示 简单的module,如fc层。
首先