论文标题:Voxel Transformer for 3D Object Detection
iccv2021
现在点云的做法大多是在点云上进行 例如首先将点云group化 然后进行分组地transformer 而这篇文章提出了一种基于voxel的transformer 可以应用于基于voxel的检测器上 方便进行voxel 3d环节的提取全局特征。
老规矩 上图!

可以看出文章的主要创新之处在于3d的backbone 这就意味着我们可以将这个模块应用到所有的基于voxel的一阶段 二阶段检测器上面。
点云voxel的3d卷积主要分为两个类别的处理:sparse and submanifold。
他们的操作也是基本一样的 除了attending voxel不同而已,这两种类别的3d操作可以先参考SECOND 三维目标检测器。
简单的来说就是用sparse进行下采样 用submanifold在保持稀疏度的情况下进行3d卷积。
对于非空的voxel 我们对于attending voxel(什么是attending voxel呢 我们下面进行定义)进行transformer操作 位置编码选择相对位置编码 有transformer基础的同学看一下下面的公式就明白~



本文介绍了一种名为VoxelTransformer的新型3D对象检测技术,该技术针对点云处理,特别是在基于体素的检测器上。与传统的点云处理方法不同,VoxelTransformer使用体素进行Transformer操作,允许更有效地提取全局特征。文章详细阐述了sparse和submanifold两种3D卷积操作,并探讨了它们在点云处理中的应用。通过local和dilated attention模块,模型能够捕获局部和广泛感受野的特征。实验结果显示,这种方法在性能和效率上都有显著优势,为3D对象检测提供了一条新的路径。
最低0.47元/天 解锁文章
1077






