本文来源公众号“极市平台”,仅用于学术分享,侵权删,干货满满。
原文链接:ECCV'24|Plain-Det:同时支持多数据集训练的新目标检测
极市导读
论文提出了Plain-Det,提供了灵活性以适应新的数据集,具有跨多样数据集的稳健性能、训练效率和与各种检测架构的兼容性。结合Def-DETR和Plain-Det,在COCO上达到51.9的mAP,匹配当前最先进的检测器。在13个下游数据集上进行了广泛的实验,Plain-Det展现了强大的泛化能力。
近期在大规模基础模型上的进展引发了对训练高效大型视觉模型的广泛关注。一个普遍的共识是必须聚合大量高质量的带注释数据。然而,鉴于计算机视觉中密集任务(如目标检测和分割)标注的固有挑战,实际的策略是结合并利用所有可用的数据进行训练。
论文提出了Plain-Det
,提供了灵活性以适应新的数据集,具有跨多样数据集的稳健性能、训练效率和与各种检测架构的兼容性。结合Def-DETR
和Plain-Det
,在COCO
上达到51.9
的mAP
,匹配当前最先进的检测器。在13
个下游数据集上进行了广泛的实验,Plain-Det
展现了强大的泛化能力。
-
论文地址:https://arxiv.org/abs/2407.10083
-
论文代码:https://github.com/SooLab/Plain-Det
Introduction
大规模数据集促进了计算机视觉的显著进步,从用于图像分类的ImageNet
到最近的图像分割数据集SA-1B
。目标检测作为计算机视觉中的基本任务之一,固有地需要大规模的带注释数据。然而,注释如此广泛和密集的对象既昂贵又具有挑战性。另一种直接且实用的方法是统一多个现有的目标检测数据集,以训练一个统一的目标检测器。然而,数据集之间的不一致性,例如如图1a
所示的不同分类法和数据分布,给多数据集训练带来了挑战。
论文旨在解决使用多