✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。
我是Srlua小谢,在这里我会分享我的知识和经验。🎥
希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。🔮
记得先点赞👍后阅读哦~ 👏👏
📘📚 所属专栏:传知代码论文复现
欢迎访问我的主页:Srlua小谢 获取更多信息和资源。✨✨🌙🌙
目录
Commonsense Prototype for Outdoor Unsupervised 3D Object Detection (CVPR 2024解读)
用于标签优化的常识原型约束框正则化(CProto-constrained Box Regularization,CBR)
常识原型约束自训练(CProto-constrained Self-Training,CST)
本文所有资源均可在该地址处获取。
Commonsense Prototype for Outdoor Unsupervised 3D Object Detection (CVPR 2024解读)
引言
今天我们介绍一篇CVPR2024的最新无监督三维目标检测的SOTA工作,这篇论文介绍了一种名为Commonsense Prototype-based Detector(CPD)的方法,用于解决无监督三维目标检测中的挑战。在当前的无监督三维目标检测方法中,通常采用基于聚类的伪标签生成和迭代式自训练过程。然而,由于激光雷达扫描的稀疏性,导致生成的伪标签存在尺寸和位置上的错误,从而影响了检测性能。为了应对这一问题,该论文提出了一种基于常识原型的检测器(CPD),以提高无监督三维目标检测的性能。

相关工作
与传统全监督学习不同的是,无监督学习要求在数据完全无标记的情况下从数据集中学习到一定知识。常见的方法包括预训练、启发式算法等。传统的DBSCAN直接对点云进行聚类,从而拟合粗糙的边界框。MODEST方法使用了通过对场景中多次遍历,来确定物体是否移动,并根据一些常识信息滤除不合理的伪标签。OYSTER通过近距离点聚类,来训练一个目标检测器,并使用CNN的平移等变性来生成远距离的伪标签,然后通过目标轨迹的时间一致性来提取自我监督信号。当然,这些方法都存在一定局限性,并且精度较低。
方法
三维目标检测中一个极为重要的问题在于:如何得到高质量的伪标签(pseudo label)。基于聚类生成的伪标签通常是极为粗糙和不准确的,因此需要设计一个生成高质量伪标签的架构。CPD的方法主要包括三个部分:
- (1)伪标签初始化
- (2)伪标签标签优化
- (3)自训练

伪标签初始化
作者观察到,连续帧中的一些静止物体看起来更完整。作者通过使用一种多帧聚类(Multi-Frame Clustering)的策略来初始化伪标签。具体做法是将将一个连续的点云序列:{x−n,...,xn}{x−n,...,xn}拼接,x−nx−n代表前n帧点云,xnxn代表后n帧。并通过计算点云的PP-Score来确定运动点,并移出当前帧之外的所有运动点,避免运动伪影对标签生成产生影响。并通过去除地面、DBSCAN、拟合检测框等操作来得到初步的伪标签b={bj}jb={bj}j,bj=[x,y,z,l,w,h,α,β,τ]bj=[x,y,z,l,w,h,α,β,τ]。分别代表检测框的位置、长宽高、方位角、类别和跟踪标识。
用于标签优化的常识原型约束框正则化(CProto-constrained Box Regularization,CBR)
基于原型学习的方法是近年来无监督学习中常见的一种策略,方



最低0.47元/天 解锁文章
1046






