自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection 论文初读

在本文中,我们通过将基于变换器的检测器 DINO 与接地预训练相结合,提出了一种名为接地 DINO 的开放集对象检测器,它可以通过类别名称或引用表达等人工输入来检测任意对象。开放集对象检测的关键解决方案是在封闭集检测器中引入语言,以实现开放集概念泛化。为了有效地融合语言和视觉模式,我们从概念上将封闭集检测器分为三个阶段,并提出了一个紧密的融合解决方案,其中包括特征增强器、语言引导的查询选择和用于跨模式融合的跨模式解码器。

2024-09-03 16:26:30 490

原创 DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection 论文初读

我们提出了DINO(带改进去噪锚盒的DETR),一种最先进的端到端目标检测器。DINO通过使用对比方法进行去噪训练,使用混合查询选择方法进行锚点初始化,使用前向两次方案进行框预测,在性能和效率上都比以前的类der模型有所提高。利用ResNet-50骨干网和多尺度特征,DINO在COCO上12个历元达到48.3AP, 36个历元达到51.0AP,与之前最好的类der模型DN-DETR相比,分别提高了+4.9AP和+2.4AP。DINO在模型大小和数据大小上都有很好的伸缩性。

2024-09-02 16:23:16 1466

原创 Expanding Low-Density Latent Regions for Open-Set Object Detection 初读笔记 (zotero+obsidian+claude)

Citation:: [1]J. Han, Y. Ren, J. Ding, X. Pan, K. Yan, and G.-S. Xia, “Expanding Low-Density Latent Regions for Open-Set Object Detection.” arXiv, May 08, 2022. Accessed: Nov. 05, 2023. [Online]. Available: http://arxiv.org/abs/2203.14911Modern object dete

2024-07-26 17:57:05 1575

原创 HSIC-based Moving Weight Averaging for Few-Shot Open-Set Object Detection 初读笔记 (obsidian+md+claude)

开集检测文章HSIC-based Moving Weight Averaging for Few-Shot Open-Set Object Detection阅读

2024-07-22 17:21:12 1600

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除