YOLO26来了

原创于 2025-10-27 09:13:09 发布 · 1.2k 阅读

CC 4.0 BY-SA版权

文章标签：

41 篇文章

订阅专栏

该文章已生成可运行项目，

Ultralytics YOLO26 是 YOLO 系列实时目标检测器的最新演进版本，专为边缘和低功耗设备从头设计。它采用了精简设计，去除了不必要的复杂性，同时整合了针对性创新，以实现更快、更轻量和更易部署的方案。

YOLO26 的架构遵循三大核心原则：

简洁性：YOLO26 是原生端到端模型，直接生成预测结果，无需非极大值抑制（NMS）后处理步骤。通过消除这一步骤，推理过程变得更快、更轻量，且更容易在实际系统中部署。这种突破性方法最初由清华大学的 Ao Wang 在 YOLOv10 中开创，并在 YOLO26 中得到进一步发展。

部署效率：端到端设计省去了整个管道阶段，显著简化了集成过程，降低了延迟，并使部署在各种环境中更加稳健。

训练创新：YOLO26 引入了 MuSGD 优化器，这是一种结合 SGD 和 Muon 的混合优化器，灵感来自 Moonshot AI 在 LLM 训练中的 Kimi K2 突破。该优化器带来了更高的稳定性和更快的收敛速度，将语言模型的优化进展转移到了计算机视觉领域。

这些创新共同打造了一个模型家族，在小物体检测上实现了更高的准确性，提供无缝部署，并在 CPU 上运行速度提升高达 43%—— 使 YOLO26 成为迄今为止资源受限环境中最实用、最易部署的 YOLO 模型之一。

在这里插入图片描述

移除 DFL 模块

尽管分布焦点损失（DFL）模块效果显著，但它常常使导出过程复杂化并限制硬件兼容性。YOLO26 完全移除了 DFL，简化了推理过程，并扩大了对边缘和低功耗设备的支持范围。

端到端无 NMS 推理

与依赖 NMS 作为单独后处理步骤的传统检测器不同，YOLO26 是原生端到端模型。预测结果直接生成，减少了延迟，使集成到生产系统的过程更快、更轻量且更可靠。

ProgLoss + STAL

改进的损失函数提高了检测精度，特别是在小物体识别方面有显著改进，这对物联网、机器人技术、航空影像和其他边缘应用至关重要。

MuSGD 优化器

这是一种结合了 SGD 和 Muon 的新型混合优化器。灵感源自 Moonshot AI 的 Kimi K2，MuSGD 将大型语言模型（LLM）训练中的先进优化方法引入计算机视觉领域，实现了更稳定的训练和更快的收敛速度。

CPU 推理速度提升高达 43%

专为边缘计算优化，YOLO26 提供显著更快的 CPU 推理速度，确保在没有 GPU 的设备上也能实现实时性能。

YOLO26 设计为多任务模型家族，扩展了 YOLO 在各种计算机视觉视觉挑战中的多功能性：

Model	Task	Inference	Validation	Training	Export
YOLO26	Detection	✅	✅	✅	✅
YOLO26-seg	Instance Segmentation	✅	✅	✅	✅
YOLO26-pose	Pose/Keypoints	✅	✅	✅	✅
YOLO26-obb	Oriented Detection	✅	✅	✅	✅
YOLO26-cls	Classification	✅	✅	✅	✅

这个统一框架确保 YOLO26 适用于实时检测、分割、分类、姿态估计和定向目标检测等多种任务 —— 所有这些任务都支持训练、验证、推理和导出功能。

以下基准测试结果为早期预览版本。最终数据和可下载权重将在训练完成后发布。

使用COCO数据集的检测指标：

Model	size (pixels)	mAPval 50-95(e2e)	mAPval 50-95	Speed CPU ONNX (ms)	Speed T4 TensorRT10 (ms)	params (M)	FLOPs (B)
YOLO26n	640	39.8	40.3	38.90 ± 0.7	1.7 ± 0.0	2.4	5.4
YOLO26s	640	47.2	47.6	87.16 ± 0.9	2.7 ± 0.0	9.5	20.7
YOLO26m	640	51.5	51.7	220.0 ± 1.4	4.9 ± 0.1	20.4	68.2
YOLO26l	640	53.0*	53.4*	286.17 ± 2.0*	6.5 ± 0.2*	24.8	86.4