arxiv:https://arxiv.org/abs/2303.11749
github:https://github.com/zhenyuw16/UniDetector

一、介绍
通用目标检测旨在检测场景那种的一切目标。现有的检测器依赖于大量数据集
通用的目标检测器应该有两个能力:1、可以利用多种来源的图片和标签训练2、可以很好的泛化到开放世界,对于没见过的类别也可以预测。
传统的目标检测,rcnn系列,只能在封闭数据集上,后来发展的开放词汇目标检测很大程度提升了性能,也能泛化到一些非常见类别,但是仍然只在一个数据集迁移,同时见过的类别比没见过的类别多,泛化能力受到限制。在多数据集上训练的问题是需要统一标签空间,为此提出了一些方法但是这些方法仍然关注于在封闭数据集上检测。
二、The UniDetector Framework

文章介绍了TheUniDetector框架,通过大尺度图像文本对齐预训练、处理异构标签空间的策略和解耦RPN与ROI分类,提升通用目标检测的泛化能力,尤其在处理未见过的类别时。
最低0.47元/天 解锁文章
952

被折叠的 条评论
为什么被折叠?



