《PointPillars: Fast Encoders for Object Detection from PointClouds》 CVPR2019
用于点云目标检测的快速编码器
文章目录
前言
首先说应用深度学习在点云上做object detection的两个思路, 一个是3D卷积,VoxelNet是第一个end to end的网络, 后来SECOND对此作了改进, 但是仍然3D卷积的瓶颈依旧明显; 另一个是投影到BEV (Bird’s Eye View)像图像做二维卷积, 第二种方法虽然时间更快, 但是点云的稀疏性让卷积的不实用,效率很低,所就用了 Fast Encoder, 简单来说就是对点云密度比较高的地方进行卷积,速度提升还是很明显的。
一、Key Points
- 提出一种新的encoding points的方式: Pillar
- fast: 62Hz ,faster version-- 105 Hz, 超过SECOND三倍。但是105Hz这样的运行时间可能会被认为是过度的,因为激光雷达的工作频率通常是20Hz。
- 对于模型能达到的速度和真实自动驾驶场景能达到的速度做了一些讨论
二、网络架构

图2.网络概述。该网络的主要组件是支柱特征网络,骨干网和SSD检测头。有关详细信息,请参阅第2节。原始点云被转换为堆叠柱张量和柱索引张量。编码器使用堆叠的柱来学习一组可以分散回到卷积神经网络的2D伪图像的特征。检测头使用骨干的特征来预测物体的3D边界框。注意:这里我们展示了汽车网络的主干尺寸。
1. Pillar Feature Network
对于识别Car而言, 识别范围为 前后左右上下[(0, 70.4), (-40, 40), (-3
点云目标检测新方法:PointPillars快速编码器解析

本文介绍了PointPillars,一种用于点云目标检测的快速编码器,旨在解决3D卷积的计算瓶颈。PointPillars通过将点云投影到二维栅格并进行卷积,提高了处理速度,达到了62Hz甚至105Hz。网络包括PillarFeatureNetwork、Backbone和DetectionHead,其中PillarFeatureNetwork采用点云密度高的区域进行卷积。尽管速度快,但可能因输入数据的筛选导致识别效果轻微下降。实验表明,PointPillars在保持速度的同时,能有效地进行对象检测。
最低0.47元/天 解锁文章
1690





