【论文阅读】【3d目标检测】HVPR: Hybrid Voxel-Point Representation for Single-stage 3D Object Detection

论文提出了一种名为HVPR的混合体素-点表示方法,用于单阶段3D对象检测。该方法结合了体素和点云特征的长处,通过交互矩阵计算和注意力机制融合特征。作者还引入了voxel内存来提高交互效率,并利用3D尺度特征考虑点云的稀疏性。实验表明,提出的Attentive Multi-scale Feature Module (AMFM)显著提升了检测效果。尽管结果可能不如某些方法,但其速度优势使其成为一个合理的比较选择。

论文标题:HVPR: Hybrid Voxel-Point Representation for Single-stage 3D Object Detection
源码地址:https://cvlab.yonsei.ac.kr/projects/HVPR

延世大学出品
文章认为voxel的方法和point的方法各有优劣,这是一个老生常谈的问题 文章让读者耳目一新的地方是两者的一种新结合方式及一种省时省力的方式来调用point feature。

老规矩 上图:
在这里插入图片描述

首先讲讲怎么提取voxel和point的特征:
对于voxel:
我们首先划分voxel的范围 这里作者划分voxel的范围是直接采用pillar的形式 对于其中的点采用的是一个tiny pointnet的形式 并跟着一个max pool的操作 (这里为啥不用VFE呢 我也不太清楚 可能是为了承袭pointpillar中的操作?)

对于point:
直接使用的是pointnet++的SA和FP层 得到local feature的交互。

随后便是文章的重点:
如何进行上述两种feature的交互呢?作者首先计算voxel和points的交互矩阵:
在这里插入图片描述
其中C为一个NM的矩阵,N是voxel的个数 M便是points的个数 我们对于这个交互矩阵取每个voxel的权重值:
在这里插入图片描述
取出每个voxel对应points的value在前k个的值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值