弱监督目标检测：ALWOD: Active Learning for Weakly-Supervised Object Detection

最新推荐文章于 2025-05-25 21:27:14 发布

原创最新推荐文章于 2025-05-25 21:27:14 发布 · 1.1k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #人工智能 #计算机视觉

论文提出了一种新的目标检测框架ALWOD，结合主动学习、弱监督和半监督，有效解决小规模数据集和精确标注的挑战。通过辅助图像生成、主动获取函数和模型指导的标注，ALWOD在部分标记数据上显著缩小与全标记模型的差距，代码开源。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文作者：Yuting Wang,Velibor Ilic,Jiatong Li,Branislav Kisacanin,Vladimir Pavlovic

作者单位：Rutgers University;The Institute for Artificial Intelligence Research and Development of Serbia;Nvidia Corporation

论文链接：http://arxiv.org/abs/2309.07914v1

项目链接：https://github.com/seqam-lab/ALWOD

内容简介：

1）方向：目标检测（Object Detection）

2）应用：视觉任务中的目标检测

3）背景：目标检测在缺乏大规模训练数据集和准确的目标定位标签的情况下仍然存在挑战。

4）方法：本文提出了一种名为ALWOD的新框架，通过将主动学习（Active Learning）与弱监督和半监督目标检测范式相结合，解决了这个问题。首先，利用极小的标记集合和大量弱标记图像集合作为主动学习的初始状态，提出了一种新的辅助图像生成策略。然后，提出了一种新的主动学习获取函数，利用学生-教师目标检测对的不一致性和不确定性，有效地提出了最具信息量的图像进行注释。最后，为了完成主动学习循环，引入了一项新的标注任务，即基于模型提出的检测结果的选择和修正，这种方法在迅速而有效地标注信息丰富的图像方面表现出色。

5）结果：在几个具有挑战性的基准测试中，ALWOD显著缩小了仅基于部分标记但经过策略选择的图像实例进行训练的目标检测器与完全标记数据依赖的目标检测器之间的差距。代码可以在https://github.com/seqam-lab/ALWOD上公开获取。