弱监督目标检测:ALWOD: Active Learning for Weakly-Supervised Object Detection

论文提出了一种新的目标检测框架ALWOD,结合主动学习、弱监督和半监督,有效解决小规模数据集和精确标注的挑战。通过辅助图像生成、主动获取函数和模型指导的标注,ALWOD在部分标记数据上显著缩小与全标记模型的差距,代码开源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文作者:Yuting Wang,Velibor Ilic,Jiatong Li,Branislav Kisacanin,Vladimir Pavlovic

作者单位:Rutgers University;The Institute for Artificial Intelligence Research and Development of Serbia;Nvidia Corporation

论文链接:http://arxiv.org/abs/2309.07914v1

项目链接:https://github.com/seqam-lab/ALWOD

内容简介:

1)方向:目标检测(Object Detection)

2)应用:视觉任务中的目标检测

3)背景:目标检测在缺乏大规模训练数据集和准确的目标定位标签的情况下仍然存在挑战。

4)方法:本文提出了一种名为ALWOD的新框架,通过将主动学习(Active Learning)与弱监督和半监督目标检测范式相结合,解决了这个问题。首先,利用极小的标记集合和大量弱标记图像集合作为主动学习的初始状态,提出了一种新的辅助图像生成策略。然后,提出了一种新的主动学习获取函数,利用学生-教师目标检测对的不一致性和不确定性,有效地提出了最具信息量的图像进行注释。最后,为了完成主动学习循环,引入了一项新的标注任务,即基于模型提出的检测结果的选择和修正,这种方法在迅速而有效地标注信息丰富的图像方面表现出色。

5)结果:在几个具有挑战性的基准测试中,ALWOD显著缩小了仅基于部分标记但经过策略选择的图像实例进行训练的目标检测器与完全标记数据依赖的目标检测器之间的差距。代码可以在https://github.com/seqam-lab/ALWOD上公开获取。

好的,这里有 100 个以上目标检测模型的推荐: 1. R-CNN (Regions with CNN features) 2. Fast R-CNN 3. Faster R-CNN 4. Mask R-CNN 5. YOLO (You Only Look Once) 6. SSD (Single Shot Detector) 7. RetinaNet 8. DSSD (Deconvolutional Single Shot Detector) 9. YOLOv2 (You Only Look Once version 2) 10. YOLOv3 (You Only Look Once version 3) 11. YOLOv4 (You Only Look Once version 4) 12. R-FCN (Region-based Fully Convolutional Network) 13. FPN (Feature Pyramid Network) 14. G-CNN (Grid-based CNN) 15. MHYPER (Multi-Hyperplane CNN) 16. HyperNet (Hyperdimensional Network) 17. F-RCNN (Faster R-CNN with Feature Pyramid Network) 18. ION (Integral Objectness Network) 19. NO-CNN (Non-Overlapping CNN) 20. MNC (MultiBox Neural Network for Object Detection) 21. MR-CNN (Multi-Region CNN) 22. L-CNN (Localization CNN) 23. RON (Reverse Connection with Objectness) 24. ML-CNN (Multiple Localization CNN) 25. STDN (Spatial Transformer Detector Network) 26. GAN-based object detection models (e.g. ODIN, Boundary-Seeking GAN) 27. 3D object detection models (e.g. PointRCNN, VoteNet) 28. Graph-based object detection models (e.g. Graph RCNN, GIN) 29. Transformers for object detection (e.g. DETR, ViT-OD) 30. Meta-learning for object detection (e.g. MetaAnchor, Meta R-CNN) 31. Hierarchical models for object detection (e.g. H-RCNN, HD-CNN) 32. Adversarial training for object detection (e.g. AdvEnt, ATOD) 33. Semi-supervised object detection (e.g. SSL-detection, S3D) 34. Weakly-supervised object detection (e.g. W-TALC, WSDDN) 35. Few-shot object detection (e.g. FSOD, F-RCNN) 36. Zero-shot object detection (e.g. ZSD-Net, ZS-OD) 37. Transfer learning for object detection (e.g. TLD, TLOD) 38. Multi-task learning for object detection (e.g. MTDNN, M2Det) 39. Knowledge distillation for object detection (e.g. KD-RCNN, DistillObjDet) 40. Domain adaptation for object detection (e.g. DANN, AdaDet) 41. Active learning for object detection (e.g. AL-RCNN, ALOD) 42. Online learning for object detection (e.g. OL-RCNN, OLEO) 43. Ensemble models for object detection (e.g. EfficientDet, E-RCNN) 44. Neural architecture search for object detection (e.g
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

学术菜鸟小晨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值