PointPillars: Fast Encoders for Object Detection from Point Clouds]
论文地址: https://arxiv.org/abs/1812.05784
代码地址: https://github.com/open-mmlab/OpenPCDet
Git链接: 计算机视觉知识汇总
课程来源 : 深蓝学院-环境感知
1.背景和亮点
这是一篇来自19年工业界的文章,在此之前对于不规则的稀疏的点云的做法普遍分为两派:
- 将点云数据量化到一个个Voxel里,常见的有VoxelNet 和SECOND , 但是这种做法比较普遍的问题是由于voxel大部分是空集所以会浪费算力(SCOND利用稀疏卷积解决了它) ,但是二者都还存在高度的信息所以还需要计算三维卷积的。
- 从俯视角度将点云的数据进行处理,将高度信息通过一系列手段去除从而获得一种类似Pseudo image的方式从而去用一些经典的图像网络去处理一些任务比如,MV3D和AVOD
本文也有点类似上面的思想2,PointPillar下文简称PP. 有以下几个明显的亮点:
- 是一种结合了点试图思想(忽略非空区域)以及俯视图(量化2D平面而得到伪图片)的点云融合感知算法
- 速度和精度的trade-off,平均速度达到了62Hz,最快达到了105Hz,下面是CIA-SSD中的精度&速度图


PointPillars提出了一种新的点云处理方法,结合点云和俯视图思想,形成2D伪图像,用于快速目标检测。网络结构包括PointFeatureNet、FPN和SSD,平均速度达到62Hz,同时保持高精度。损失函数包括位置、分类和方向差异损失,优化3D物体检测。文章还讨论了改进策略,如提高分辨率和多传感器融合。
最低0.47元/天 解锁文章
3320

被折叠的 条评论
为什么被折叠?



