【论文阅读】【3d目标检测】Voxel Transformer for 3D Object Detection

本文介绍了一种名为VoxelTransformer的新型3D对象检测技术,该技术针对点云处理,特别是在基于体素的检测器上。与传统的点云处理方法不同,VoxelTransformer使用体素进行Transformer操作,允许更有效地提取全局特征。文章详细阐述了sparse和submanifold两种3D卷积操作,并探讨了它们在点云处理中的应用。通过local和dilated attention模块,模型能够捕获局部和广泛感受野的特征。实验结果显示,这种方法在性能和效率上都有显著优势,为3D对象检测提供了一条新的路径。

论文标题:Voxel Transformer for 3D Object Detection

iccv2021
现在点云的做法大多是在点云上进行 例如首先将点云group化 然后进行分组地transformer 而这篇文章提出了一种基于voxel的transformer 可以应用于基于voxel的检测器上 方便进行voxel 3d环节的提取全局特征。
老规矩 上图!
在这里插入图片描述
可以看出文章的主要创新之处在于3d的backbone 这就意味着我们可以将这个模块应用到所有的基于voxel的一阶段 二阶段检测器上面。
点云voxel的3d卷积主要分为两个类别的处理:sparse and submanifold。
他们的操作也是基本一样的 除了attending voxel不同而已,这两种类别的3d操作可以先参考SECOND 三维目标检测器。
简单的来说就是用sparse进行下采样 用submanifold在保持稀疏度的情况下进行3d卷积。
对于非空的voxel 我们对于attending voxel(什么是attending voxel呢 我们下面进行定义)进行transformer操作 位置编码选择相对位置编码 有transformer基础的同学看一下下面的公式就明白~
在这里插入图片描述
在这里插入图片描述

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值