【论文阅读】【3d目标检测】CIA-SSD

该论文提出了一种名为CIA-SSD的3D目标检测器,它在点云数据上实现快速且准确的检测。方法包括体素编码、SSFA模块和IoU感知的NMS策略。SSFA模块通过两组卷积增强特征,而IoU-Aware Confidence解决了NMS中置信度和IoU不匹配的问题。在训练时分开预测,推理时结合使用,优化了检测效果。尽管体素化过程可能丢失一些信息,但整体框架表现出良好的性能和效率。

论文标题:CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud

2021AAAI 香港中文大学出品
达到了不错的ap,速度也挺快的。
在这里插入图片描述
老规矩,上图!
在这里插入图片描述
文章框架很明了,主要是进行了三步操作:

首先是encode

利用second的框架,首先对于原始点云进行voxel化,随后ssc卷积生成dense feature map 这个dense是针对于z方向而言的。生成BEV feature map后输入到ssfa模块。

SSFA

SSFA模块分为两个group,对于spatial group,我们保持维度不变,进行卷积,使得feature的感受野变大。
对于semantic group 作者指出为了得到更高维的信息,进行一个spatial维度的降低,同时增大feature
的channel。
最后利用deconv恢复semantic group的feature维度。一支输送到spatial group将两个group的feature进行concat拼接。
另一分支则进行两个group的特征融合:
在这里插入图片描述

引入了自注意力机制。

随后对于得到的feature map执行多任务

head

为了消除confidence和iou预测值两者不匹配的问题,作者提出了一个新的辅助变量: IoU-Aware Confidence
主要思想就是原来的nms依靠于confidence,而作者通过实验发现预测出来的iou是有判别力的:
在这里插入图片描述
为了让预测出来iou较高的bbox能contribute更多,作者引入了一个超参数β,在这里插入图片描述
随后与class score进行相乘,用这个数来进行nms操作。
这样做的好处是:让使得iou高与低的bbox的效果得到极化。
在训练过程中 iou与class score的预测分开来训练,只有推理的时候采用f来进行nms操作。

新nms:
在这里插入图片描述
主要思想就是多个bbox回归proposals。
感觉是一个通用的框架

我的思考:

快在哪?
文章前半部分仿照了second 后半部分进行2d卷积,主要的计算存在于3d卷积中,要说快在哪 我觉得是文章没有采用vfe来提取体素特征,而是直接采用平均法代表每个体素。
在这里插入图片描述
这样做的坏处就是体素化后 单个体素内点的信息损失了一部分。ap会有一些损失。

好在哪?
提出了iou来监督nms,iou的预测来进行网络参数后向传播也对于网络优化有一定的作用。

总之 文章提出了一个通用的nms 以后写文章可以借鉴

### SSDCIA-SSD 目标检测算法的差异及应用场景 单阶段目标检测器中,**SSD(Single Shot MultiBox Detector)** 是早期具有代表性的方法之一,它通过在多个特征图上进行边界框预测和分类任务实现多尺度检测。该模型在卷积层输出层直接预测类别概率和边界框坐标,结合预设的默认框(default boxes)机制提升对不同长宽比目标的适应能力[^1]。 相比之下,**CIA-SSD(Contextual Information-Aware Single Shot Multibox Detector)** 是对 SSD 的改进版本,主要增强了上下文信息的建模能力。CIA-SSD 在骨干网络后引入了多尺度上下文感知模块(MS-CAM),用于融合不同层级的语义信息,并优化小目标和遮挡场景下的检测效果。此外,CIA-SSD 还采用了注意力机制来增强关键区域的特征表示,从而提升整体检测精度[^2]。 #### 检测性能对比 在 COCO 和 PASCAL VOC 等标准数据集上的实验表明,CIA-SSD 在 mAP(mean Average Precision)指标上优于原始 SSD,在小目标(small objects)和复杂背景(cluttered background)场景下表现尤为突出。这种性能提升主要归因于其更有效的上下文建模策略和注意力机制的设计[^3]。 #### 应用场景分析 - **SSD** 更适用于对实时性要求较高、硬件资源有限的场景,如边缘设备上的图像识别、智能摄像头等。由于其结构相对简单,推理速度较快,适合部署在嵌入式系统中。 - **CIA-SSD** 则更适合需要高精度检测的场景,例如自动驾驶中的行人检测、工业质检中的缺陷识别等。虽然其计算量略高于 SSD,但带来的精度增益使其在对准确率敏感的应用中更具优势。 #### 代码示例:构建 SSD 模型 以下是一个基于 PyTorch 实现的 SSD 模型简化版定义: ```python import torch from torchvision.models.detection import ssd300_vgg16, SSD300_VGG16_Weights # 加载预训练的 SSD300 模型 model = ssd300_vgg16(weights=SSD300_VGG16_Weights.DEFAULT) model.eval() # 示例输入 x = torch.rand(1, 3, 300, 300) output = model(x) ``` ---
评论 6
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值