Towards Open World Object Detection - CVPR 2021 Oral(面向开放世界的目标检测)

本文探讨了开放世界目标检测的概念,包括如何在无监督下识别未知对象、RPN自动标记未知目标、能量基未知标识器以及缓解遗忘的方法。ORE模型展示了其在增量学习中的优势与挑战,通过实例展示成功和失败案例,揭示了在不断扩展的知识库中保持学习能力的技术细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Towards Open World Object Detection
代码

什么是开放世界中的目标检测呢?
1.在没有明确监督的情况下,将未被引入的对象识别为“未知”。

2.当逐步接收到相应的标签时,在不忘记之前学习过的类的情况下,逐步学习这些已识别的未知类别。
在这里插入图片描述 图中展示了每一个增量学习的步骤,模型识别出那些未知的目标(“?”)。这些未知目标被逐渐标注(蓝色圆圈),并加入到现有的知识库(绿色圆圈)中。开放世界目标检测模型通过Energy Based Unknown Identifier和Auto-labelling Unknowns with RPN来识别出那些潜在的未知目标。

文中提到的开放世界对象探测器
1.对比聚类:
一个对比的集群问题,在这类问题中,相同类的实例将被强制保持在附近,而不同类的实例将被推到很远的地方。
2.用RPN自动标记未知:
给定一个输入图像,RPN(Region Proposal Network)生成一组前景和背景实例的边框预测,以及相应的对象性分数。将那些具有较高的对象分数,但不与地面真实对象重叠的建议标记为潜在的未知对象。
3.基于能量的未知识别器:
学习一个能量函数E (F,L)。使用亥姆霍兹自由能公式,建立ξkn(f)和ξunk(f)的能量分布模型,如果ξkn(f) < ξunk(f),所学的分布可以用来标记一个未知的预测。
4.缓解遗忘:
存储一组平衡的样本,并在每个增量步骤之后对模型进行微调来缓解ORE的遗忘

ORE创新点:
1.在目标检测器的训练过程中,将那些未知的目标当做背景。
2.ORE是一个到目前为止还没有正式定义和解决的新问题。
3.ORE是基于对比聚类、未知感知提议网络和基于能量的未知识别,
以应对开放世界探测的挑战。
5.当增量地添加n个新类时,模型会更新自身以生成一个更新的模型 ,而无需从头开始对整个数据集进行再训练。

成功的按例:
在这里插入图片描述
在这里插入图片描述
仅在任务1上训练的ORE,在子图(a)中成功地将风筝定位为未知,而在任务3中学习风筝之后,它逐渐学习在子图(b)中同时检测风筝和飞机。
在这里插入图片描述
时钟类最终作为任务4的一部分(在子图(b)中)学习,最初被识别为未知(在子图(a)中)。ORE显示了开放世界探测器的真实特征,在那里它能够逐渐学习已识别的未知。
在这里插入图片描述

失败的按例:

子图(a)是ORE学习任务2后产生的结果。由于任务3类(如apple和orange)尚未引入,ORE将其标识并正确地将其标记为未知。学习任务3后,这些实例在子图(b)中正确标记。一个未识别的类实例仍然存在,并且ORE成功地将其检测为未知。
在这里插入图片描述
在任务2中,行李箱被识别为未知的东西最终被学习到,同时错误地发现了椅子。
在这里插入图片描述
在这个高度混乱的场景中,在学习Task 2之后,未知的实例时钟被识别出来,但并没有很好地进行本地化。学习任务4后,ORE检测时钟,减少汽车和自行车的误报。学习了这两项任务后,红色的行李箱都没有贴上标签,因此是一个失败的案例。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值