【论文阅读】【3d目标检测】CIA-SSD

最新推荐文章于 2024-01-25 16:08:31 发布

原创最新推荐文章于 2024-01-25 16:08:31 发布 · 2.1k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #人工智能 #计算机视觉 #深度学习 #算法

论文阅读专栏收录该内容

37 篇文章

订阅专栏

该论文提出了一种名为CIA-SSD的3D目标检测器，它在点云数据上实现快速且准确的检测。方法包括体素编码、SSFA模块和IoU感知的NMS策略。SSFA模块通过两组卷积增强特征，而IoU-Aware Confidence解决了NMS中置信度和IoU不匹配的问题。在训练时分开预测，推理时结合使用，优化了检测效果。尽管体素化过程可能丢失一些信息，但整体框架表现出良好的性能和效率。

论文标题：CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud

2021AAAI 香港中文大学出品
达到了不错的ap，速度也挺快的。
在这里插入图片描述
老规矩，上图！

文章框架很明了，主要是进行了三步操作：

首先是encode

利用second的框架，首先对于原始点云进行voxel化，随后ssc卷积生成dense feature map 这个dense是针对于z方向而言的。生成BEV feature map后输入到ssfa模块。

SSFA

SSFA模块分为两个group，对于spatial group，我们保持维度不变，进行卷积，使得feature的感受野变大。
对于semantic group 作者指出为了得到更高维的信息，进行一个spatial维度的降低，同时增大feature
的channel。
最后利用deconv恢复semantic group的feature维度。一支输送到spatial group将两个group的feature进行concat拼接。
另一分支则进行两个group的特征融合：
在这里插入图片描述

引入了自注意力机制。

随后对于得到的feature map执行多任务

head

为了消除confidence和iou预测值两者不匹配的问题，作者提出了一个新的辅助变量： IoU-Aware Confidence
主要思想就是原来的nms依靠于confidence，而作者通过实验发现预测出来的iou是有判别力的：
在这里插入图片描述
为了让预测出来iou较高的bbox能contribute更多，作者引入了一个超参数β，
随后与class score进行相乘，用这个数来进行nms操作。
这样做的好处是：让使得iou高与低的bbox的效果得到极化。
在训练过程中 iou与class score的预测分开来训练，只有推理的时候采用f来进行nms操作。

新nms：
在这里插入图片描述
主要思想就是多个bbox回归proposals。
感觉是一个通用的框架

我的思考：

快在哪？
文章前半部分仿照了second 后半部分进行2d卷积，主要的计算存在于3d卷积中，要说快在哪我觉得是文章没有采用vfe来提取体素特征，而是直接采用平均法代表每个体素。
在这里插入图片描述
这样做的坏处就是体素化后单个体素内点的信息损失了一部分。ap会有一些损失。

好在哪？
提出了iou来监督nms，iou的预测来进行网络参数后向传播也对于网络优化有一定的作用。

总之文章提出了一个通用的nms 以后写文章可以借鉴

6 条评论

weixin_51264287 2022.05.16
你了解怎么输出模型的test结果吗原文跑通输出的是val部分的结果
- Lukas88664回复weixin_51264287 2022.05.17
  不是的你可以在验证集上跑看你的算法结果你可以先了解一下数据集的基本知识
- weixin_51264287回复Lukas88664 2022.05.17
  啊？那只要用这个数据集做实验就要提交给kitti官方准确率吗？
- Lukas88664回复weixin_51264287 2022.05.16
  那是人家在test上做实验呀提交给kitti官方进行排行的数据
- weixin_51264287回复Lukas88664 2022.05.16
  但是我看着相关的文章一般都给出了test的结果呢
- Lukas88664回复weixin_51264287 2022.05.16
  抱歉没跑过这篇论文的代码不过论文都是在验证集上做？