PointPillars 学习笔记

点云目标检测新方法：PointPillars快速编码器解析

最新推荐文章于 2025-10-27 10:44:14 发布

原创

最新推荐文章于 2025-10-27 10:44:14 发布 · 1.7k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#计算机视觉

本文介绍了PointPillars，一种用于点云目标检测的快速编码器，旨在解决3D卷积的计算瓶颈。PointPillars通过将点云投影到二维栅格并进行卷积，提高了处理速度，达到了62Hz甚至105Hz。网络包括PillarFeatureNetwork、Backbone和DetectionHead，其中PillarFeatureNetwork采用点云密度高的区域进行卷积。尽管速度快，但可能因输入数据的筛选导致识别效果轻微下降。实验表明，PointPillars在保持速度的同时，能有效地进行对象检测。

《PointPillars: Fast Encoders for Object Detection from PointClouds》 CVPR2019

用于点云目标检测的快速编码器

前言

首先说应用深度学习在点云上做object detection的两个思路，一个是3D卷积，VoxelNet是第一个end to end的网络，后来SECOND对此作了改进，但是仍然3D卷积的瓶颈依旧明显; 另一个是投影到BEV (Bird’s Eye View)像图像做二维卷积，第二种方法虽然时间更快，但是点云的稀疏性让卷积的不实用，效率很低，所就用了 Fast Encoder，简单来说就是对点云密度比较高的地方进行卷积，速度提升还是很明显的。

一、Key Points

提出一种新的encoding points的方式: Pillar
fast: 62Hz ，faster version-- 105 Hz，超过SECOND三倍。但是105Hz这样的运行时间可能会被认为是过度的，因为激光雷达的工作频率通常是20Hz。
对于模型能达到的速度和真实自动驾驶场景能达到的速度做了一些讨论