Detrs beat yolos on real-time object detection

Abstract

然而,我们观察到nnms对yolo的速度和准确性产生了负面影响。最近,端到端基于变压器的检测器(DETRs)为消除NMS提供了一种替代方案。然而,高昂的计算成本限制了它们的实用性,阻碍了它们充分发挥排除NMS的优势。在本文中,我们提出了实时检测变压器(RT-DETR),这是我们所知的第一个解决上述困境的实时端到端对象检测器。我们在先进的DETR基础上分两步构建RT-DETR:首先我们专注于在提高速度的同时保持精度,其次是在提高精度的同时保持速度。具体而言,我们设计了一种高效的混合编码器,通过解耦尺度内相互作用和跨尺度融合来快速处理多尺度特征,以提高速度。

网络架构图

RT-DETR概述。我们将主干最后三个阶段的特征输入到编码器中。高效混合编码器通过基于注意力的尺度内特征交互(AIFI)和基于cnn的跨尺度特征融合(CCFF)将多尺度特征转化为图像特征序列。然后,最小不确定性查询选择选择固定数量的编码器特征作为解码器的初始对象查询。最后,具有辅助预测头的解码器迭代优化对象查询以生成类别和框。

results

我们的RT-DETR-R50实现了53.1%的AP和108 FPS,而RTDETR-R101实现了54.3%的AP和74 FPS,在速度和精度上都优于最先进的类似规模的YOLO探测器和相同骨干的detr。

### DETRsYOLOs在实时目标检测中的性能比较 #### 背景介绍 实时目标检测领域长期以来由基于锚框(anchor-based)的传统方法主导,而近年来无锚框(anchor-free)的方法逐渐崭露头角。YOLO系列作为经典的单阶段检测框架,以其快速推理速度闻名;然而,其精度相较于双阶段检测器仍有差距。DETR(Detection Transformer),作为一种全新的目标检测范式,通过引入Transformer架构解决了传统卷积神经网络的局限性,但在早期版本中因较高的计算复杂度难以满足实时需求。 #### RT-DETR的设计理念及其优势 RT-DETR继承了DETR的核心思想并针对实时场景进行了优化改进[^1]。它不仅提升了模型的速度表现,还保持了高精度水平。这种设计上的创新使其成为首个能够挑战甚至超越主流YOLO变体的DETR类模型。 #### 性能对比分析 具体来说,在多个维度上可以观察到两者之间的差异: 1. **精确率方面** - 对比不同规模下的YOLO版本,无论是轻量级还是重量级配置,RT-DETR均展现出显著更高的平均精度(AP)[^2]。 - 例如相对于YOLOv5-L/PP-YOLOE-L/YOLOv6-L, 提升幅度分别为4.1%/1.7%/0.3% AP. - 同样对于更大尺寸模型如YOLOv7-X/YOLOv8-X也有正向增益约1.4%-1.9%. 2. **运行效率考量** - 不仅如此,在每秒帧数(FPS)指标下同样占据领先地位: - 面对同级别竞争对手时(比如YOLOv5-X 或 PP-YOLOE-X), 增幅可达数十个百分点以上 (最高接近两倍). 3. **资源消耗评估** - 此外值得注意的是尽管取得了上述进步却并未增加额外负担反而有所减少——体现在所需参数总量下降比例可观. 综上所述可以看出无论是在衡量质量的关键标准即mAP得分亦或是实际应用关心的操作频率乃至存储空间占用等方面都证明了新一代解决方案具备更强竞争力. ```python # 示例代码展示如何加载预训练权重进行测试 import torch from rt_detr import build_model device = 'cuda' if torch.cuda.is_available() else 'cpu' model, criterion, postprocessors = build_model('rt-detr-r50', num_classes=80).to(device) checkpoint = torch.load("path_to_pretrained_weights", map_location=device) model.load_state_dict(checkpoint['model']) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值