【论文阅读】【3d目标检测】TANet: Robust 3D Object Detection from Point Clouds with Triple Attention

最新推荐文章于 2024-02-28 11:23:33 发布

原创

最新推荐文章于 2024-02-28 11:23:33 发布 · 1.1k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#3d #目标检测 #计算机视觉

TANet是一种用于3D点云对象检测的深度学习模型，通过三重注意力机制增强对小目标的检测能力。文章介绍了其点级、通道级和体素级的注意力模块，展示了在网络中对点云的精细化处理如何提升小物体检测的鲁棒性。TAmodule的创新点在于其点云的voxel处理、点、通道和体素的注意力权重分配，以及全局意识的voxel-point生成。实验结果证明了模型对噪声的抵抗力以及对小目标检测的优秀性能。

论文题目：TANet: Robust 3D Object Detection from Point Clouds with Triple Attention

代码开源出来的可以放心使用！
文章在kitti上做的实验，发现对于小目标的检测效果很好作者也做了一些噪声的实验主要是在物体上加噪声，以此来证明网络的鲁棒性。这是文章的两个出发点。
在这里插入图片描述
这是怎么做的呢？
主要是作者认为考虑点级别、channel级别和voxel级别的检测器，对于小物体的效果是好的。因为这些小物体本身上面的点云就很小，如果和大物体例如车辆一样，对他们上面的点云一视同仁形成一个个voxel来进行检测，那效果肯定是不如车辆的检测效果的。

老规矩上图：
在这里插入图片描述
文章让我耳目一新的主要是TA module。后面的回归模块实际上没啥可说的。
我们先来看看TA module：
首先对于点云进行voxel处理，注意这里只是将点云划分到了每一个格子中，没有对他们进行其他的操作。假设每个voxel中的最大点云数是N，总共有K个voxel，每个点云的feature维度为C，经过这一步我们得到的是一个KNC的矩阵。PS：作者这里进行的voxel实际上是进行pillar化，所以在Z维度上只有一个voxel。