无监督目标检测最新CVPR解读


✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨

🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。

我是Srlua小谢,在这里我会分享我的知识和经验。🎥

希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。🔮

记得先点赞👍后阅读哦~ 👏👏

📘📚 所属专栏:传知代码论文复现

欢迎访问我的主页:Srlua小谢 获取更多信息和资源。✨✨🌙🌙

​​

​​

目录

Commonsense Prototype for Outdoor Unsupervised 3D Object Detection (CVPR 2024解读)

引言

相关工作

方法

伪标签初始化

用于标签优化的常识原型约束框正则化(CProto-constrained Box Regularization,CBR)

常识原型约束自训练(CProto-constrained Self-Training,CST)

效果对比

核心代码

数据集处理

网络定义

配置文件

使用方式

环境安装

Waymo数据集准备

训练和评估


 本文所有资源均可在该地址处获取。

Commonsense Prototype for Outdoor Unsupervised 3D Object Detection (CVPR 2024解读)

论文地址 | 项目地址 | 讲解视频

引言

今天我们介绍一篇CVPR2024的最新无监督三维目标检测的SOTA工作,这篇论文介绍了一种名为Commonsense Prototype-based Detector(CPD)的方法,用于解决无监督三维目标检测中的挑战。在当前的无监督三维目标检测方法中,通常采用基于聚类的伪标签生成和迭代式自训练过程。然而,由于激光雷达扫描的稀疏性,导致生成的伪标签存在尺寸和位置上的错误,从而影响了检测性能。为了应对这一问题,该论文提出了一种基于常识原型的检测器(CPD),以提高无监督三维目标检测的性能。

相关工作

与传统全监督学习不同的是,无监督学习要求在数据完全无标记的情况下从数据集中学习到一定知识。常见的方法包括预训练、启发式算法等。传统的DBSCAN直接对点云进行聚类,从而拟合粗糙的边界框。MODEST方法使用了通过对场景中多次遍历,来确定物体是否移动,并根据一些常识信息滤除不合理的伪标签。OYSTER通过近距离点聚类,来训练一个目标检测器,并使用CNN的平移等变性来生成远距离的伪标签,然后通过目标轨迹的时间一致性来提取自我监督信号。当然,这些方法都存在一定局限性,并且精度较低。

方法

三维目标检测中一个极为重要的问题在于:如何得到高质量的伪标签(pseudo label)。基于聚类生成的伪标签通常是极为粗糙和不准确的,因此需要设计一个生成高质量伪标签的架构。CPD的方法主要包括三个部分:

  • (1)伪标签初始化
  • (2)伪标签标签优化
  • (3)自训练

伪标签初始化

作者观察到,连续帧中的一些静止物体看起来更完整。作者通过使用一种多帧聚类(Multi-Frame Clustering)的策略来初始化伪标签。具体做法是将将一个连续的点云序列:{x−n,...,xn}{x−n​,...,xn​}拼接,x−nx−n​代表前n帧点云,xnxn​代表后n帧。并通过计算点云的PP-Score来确定运动点,并移出当前帧之外的所有运动点,避免运动伪影对标签生成产生影响。并通过去除地面、DBSCAN、拟合检测框等操作来得到初步的伪标签b={bj}jb={bj​}j​,bj=[x,y,z,l,w,h,α,β,τ]bj​=[x,y,z,l,w,h,α,β,τ]。分别代表检测框的位置、长宽高、方位角、类别和跟踪标识。

用于标签优化的常识原型约束框正则化(CProto-constrained Box Regularization,CBR)

基于原型学习的方法是近年来无监督学习中常见的一种策略,方

### 无监督学习在目标检测中的应用 #### 方法概述 为了应对缺乏标注数据的问题,研究者们开发了多种无监督学习方法来进行目标检测。这类方法旨在从未标注的数据中提取有用的信息并构建有效的模型[^1]。 一种典型的技术称为OYSTER,这种方法通过局部区域内的点聚集形成初步的目标假设,并利用卷积神经网络(CNN)的空间不变性生成远程伪标签。随后,依靠时间序列上的一致性约束进一步优化这些预测结果。此过程能够捕捉到动态环境中物体随时间变化的状态[^3]。 另一种值得注意的方法是MODEST,它通过对环境的重复扫描识别潜在的对象实例,并采用启发式的规则去除那些不符合物理规律的错误标记。尽管这种方式表现出良好的抗噪能力,但在处理大规模数据集时仍需一定程度的人工干预以确保质量。 对于更广泛的解决方案探索,Active Teacher框架被提出作为半监督设置下的有效工具,在CVPR 2023会议上得到了详细介绍。这种方案允许教师模型指导学生模型的学习进程,即使是在仅有少量已知样本可用的情况下也能保持较高的性能水平[^2]。 #### 学习资源推荐 针对希望深入了解这个领域的人来说,《传知代码》提供了详细的CVPR会议论文解读文章,特别是有关于无监督目标检测部分的内容更新及时且深入浅出,非常适合初学者入门。 此外,GitHub平台上存在许多开源项目实现了上述提到的各种算法和技术概念,比如MMDetection库就包含了丰富的预训练模型以及易于扩展的研究平台支持自定义实验设计;而Detectron2则是由Facebook AI Research维护的一个灵活高效的计算机视觉研究工具包,其中也涵盖了最新的研究成果实现版本。 ```python import torch from mmdet.apis import init_detector, inference_detector config_file = 'configs/faster_rcnn_r50_fpn_1x_coco.py' checkpoint_file = 'checkpoints/faster_rcnn_r50_fpn_1x_coco.pth' model = init_detector(config_file, checkpoint_file, device='cuda:0') result = inference_detector(model, img) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值