无监督目标检测最新CVPR解读

原创

于 2024-12-09 20:45:45 发布 · 1.6k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#python #人工智能

✨✨ 欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨

🌟🌟 欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。

我是Srlua小谢，在这里我会分享我的知识和经验。🎥

希望在这里，我们能一起探索IT世界的奥妙，提升我们的技能。🔮

记得先点赞👍后阅读哦~ 👏👏

📘📚 所属专栏：传知代码论文复现

欢迎访问我的主页：Srlua小谢获取更多信息和资源。✨✨🌙🌙

Commonsense Prototype for Outdoor Unsupervised 3D Object Detection (CVPR 2024解读)

引言

Commonsense Prototype for Outdoor Unsupervised 3D Object Detection (CVPR 2024解读)

论文地址 | 项目地址 | 讲解视频

引言

今天我们介绍一篇CVPR2024的最新无监督三维目标检测的SOTA工作，这篇论文介绍了一种名为Commonsense Prototype-based Detector（CPD）的方法，用于解决无监督三维目标检测中的挑战。在当前的无监督三维目标检测方法中，通常采用基于聚类的伪标签生成和迭代式自训练过程。然而，由于激光雷达扫描的稀疏性，导致生成的伪标签存在尺寸和位置上的错误，从而影响了检测性能。为了应对这一问题，该论文提出了一种基于常识原型的检测器（CPD），以提高无监督三维目标检测的性能。

方法

三维目标检测中一个极为重要的问题在于：如何得到高质量的伪标签(pseudo label)。基于聚类生成的伪标签通常是极为粗糙和不准确的，因此需要设计一个生成高质量伪标签的架构。CPD的方法主要包括三个部分:

(1)伪标签初始化
(2)伪标签标签优化
(3)自训练

伪标签初始化

作者观察到，连续帧中的一些静止物体看起来更完整。作者通过使用一种多帧聚类(Multi-Frame Clustering)的策略来初始化伪标签。具体做法是将将一个连续的点云序列：{x−n,...,xn}{x−n,...,xn}拼接，x−nx−n代表前n帧点云，xnxn代表后n帧。并通过计算点云的PP-Score来确定运动点，并移出当前帧之外的所有运动点，避免运动伪影对标签生成产生影响。并通过去除地面、DBSCAN、拟合检测框等操作来得到初步的伪标签b={bj}jb={bj}j,bj=[x,y,z,l,w,h,α,β,τ]bj=[x,y,z,l,w,h,α,β,τ]。分别代表检测框的位置、长宽高、方位角、类别和跟踪标识。