PointPillars 学习笔记

点云目标检测新方法:PointPillars快速编码器解析
本文介绍了PointPillars,一种用于点云目标检测的快速编码器,旨在解决3D卷积的计算瓶颈。PointPillars通过将点云投影到二维栅格并进行卷积,提高了处理速度,达到了62Hz甚至105Hz。网络包括PillarFeatureNetwork、Backbone和DetectionHead,其中PillarFeatureNetwork采用点云密度高的区域进行卷积。尽管速度快,但可能因输入数据的筛选导致识别效果轻微下降。实验表明,PointPillars在保持速度的同时,能有效地进行对象检测。

《PointPillars: Fast Encoders for Object Detection from PointClouds》 CVPR2019

用于点云目标检测的快速编码器


前言

首先说应用深度学习在点云上做object detection的两个思路, 一个是3D卷积,VoxelNet是第一个end to end的网络, 后来SECOND对此作了改进, 但是仍然3D卷积的瓶颈依旧明显; 另一个是投影到BEV (Bird’s Eye View)像图像做二维卷积, 第二种方法虽然时间更快, 但是点云的稀疏性让卷积的不实用,效率很低,所就用了 Fast Encoder, 简单来说就是对点云密度比较高的地方进行卷积,速度提升还是很明显的。

一、Key Points

  1. 提出一种新的encoding points的方式: Pillar
  2. fast: 62Hz ,faster version-- 105 Hz, 超过SECOND三倍。但是105Hz这样的运行时间可能会被认为是过度的,因为激光雷达的工作频率通常是20Hz。
  3. 对于模型能达到的速度和真实自动驾驶场景能达到的速度做了一些讨论

二、网络架构

在这里插入图片描述

图2.网络概述。该网络的主要组件是支柱特征网络,骨干网和SSD检测头。有关详细信息,请参阅第2节。原始点云被转换为堆叠柱张量和柱索引张量。编码器使用堆叠的柱来学习一组可以分散回到卷积神经网络的2D伪图像的特征。检测头使用骨干的特征来预测物体的3D边界框。注意:这里我们展示了汽车网络的主干尺寸。

1. Pillar Feature Network

对于识别Car而言, 识别范围为 前后左右上下[(0, 70.4), (-40, 40), (-3

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值