DINO: 基于改进的去噪锚框的端到端目标检测
【免费下载链接】DINO 项目地址: https://gitcode.com/gh_mirrors/dino1/DINO
项目基础介绍和主要编程语言
DINO(DETR with Improved DeNoising Anchor Boxes)是一个基于PyTorch的开源项目,旨在实现端到端的目标检测。该项目由IDEA-Research团队开发,并在ICLR 2023上发表。DINO的主要编程语言是Python,依赖于PyTorch框架进行深度学习模型的实现和训练。
项目核心功能
DINO的核心功能是通过改进的去噪锚框(DeNoising Anchor Boxes)来提升DETR(DEtection TRansformer)模型的性能。具体来说,DINO在以下几个方面表现出色:
- 高性能与端到端检测:DINO在COCO数据集上实现了63.2 AP(验证集)和63.3 AP(测试集)的高精度,同时模型大小和数据量远小于之前的最佳模型。
- 快速收敛:使用ResNet-50作为骨干网络,DINO在12个epoch内可以达到49.4 AP,在24个epoch内达到51.3 AP。
- 多尺度支持:DINO支持4尺度和5尺度的模型,能够在不同尺度的图像上进行高效的目标检测。
项目最近更新的功能
DINO项目近期更新了以下功能和改进:
- Semantic-SAM发布:2023年7月10日,团队发布了Semantic-SAM,这是一个通用的图像分割模型,能够在任何期望的粒度上进行分割和识别。
- OpenSeeD模型发布:2023年4月28日,团队发布了OpenSeeD,这是一个强大的开放集目标检测和分割模型,在开放集目标分割任务上取得了最佳结果。
- Stable-DINO发布:2023年4月26日,团队发布了Stable-DINO,基于DINO和FocalNet-Huge骨干网络,在COCO test-dev上达到了64.8 AP。
- DINO-4scale模型优化:2023年4月22日,通过优化超参数,DINO-4scale模型在12个epoch的设置下达到了49.8 AP。
- Grounding DINO发布:2023年3月13日,团队发布了Grounding DINO,这是一个强大的开放集目标检测模型,在COCO检测任务上取得了52.5 zero-shot AP和63.0 AP(微调后)。
这些更新不仅提升了DINO的性能,还扩展了其在不同任务中的应用范围,使其成为一个更加全面和强大的目标检测工具。
【免费下载链接】DINO 项目地址: https://gitcode.com/gh_mirrors/dino1/DINO
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



