超越YOLOv8，飞桨推出精度最高的实时检测器RT-DETR！

最新推荐文章于 2025-02-28 11:04:24 发布

小厂程序猿

最新推荐文章于 2025-02-28 11:04:24 发布

阅读量810

点赞数 2

CC 4.0 BY-SA版权

文章标签： YOLO paddlepaddle 人工智能

本文链接：https://blog.youkuaiyun.com/qq_39931336/article/details/139907031

众所周知，实时目标检测( Real-Time Object Detection )一直由 YOLO 系列模型主导。

飞桨在去年 3 月份推出了高精度通用目标检测模型 PP-YOLOE ，同年在 PP-YOLOE 的基础上提出了 PP-YOLOE+ 。后者在训练收敛速度、下游任务泛化能力以及高性能部署能力方面均达到了很好的效果。而继 PP-YOLOE 提出后，MT-YOLOv6、YOLOv7、DAMO-YOLO、RTMDet 等模型先后被提出，一直迭代到今年开年的 YOLOv8。

而我们一直在思考，实时目标检测器除了 YOLO 是否还有其他技术路线可以探索呢？

YOLO 检测器有个较大的待改进点是需要 NMS 后处理，其通常难以优化且不够鲁棒，因此检测器的速度存在延迟。为避免该问题，我们将目光移向了不需要 NMS 后处理的 DETR，一种基于 Transformer 的端到端目标检测器。然而，相比于 YOLO 系列检测器，DETR 系列检测器的速度要慢的多，这使得"无需 NMS "并未在速度上体现出优势。上述问题促使我们针对实时的端到端检测器进行探索，旨在基于 DETR 的优秀架构设计一个全新的实时检测器，从根源上解决 NMS 对实时检测器带来的速度延迟问题。

由此，我们正式推出了——RT-DETR (Real-Time DEtection TRansformer) ，一种基于 DETR 架构的实时端到端检测器，其在速度和精度上取得了 SOTA 性能。