概述
Ultralytics YOLO26 是 YOLO 系列实时目标检测器的最新演进版本,专为边缘和低功耗设备从头设计。它采用了精简设计,去除了不必要的复杂性,同时整合了针对性创新,以实现更快、更轻量和更易部署的方案。
YOLO26 的架构遵循三大核心原则:
简洁性:YOLO26 是原生端到端模型,直接生成预测结果,无需非极大值抑制(NMS)后处理步骤。通过消除这一步骤,推理过程变得更快、更轻量,且更容易在实际系统中部署。这种突破性方法最初由清华大学的 Ao Wang 在 YOLOv10 中开创,并在 YOLO26 中得到进一步发展。
部署效率:端到端设计省去了整个管道阶段,显著简化了集成过程,降低了延迟,并使部署在各种环境中更加稳健。
训练创新:YOLO26 引入了 MuSGD 优化器,这是一种结合 SGD 和 Muon 的混合优化器,灵感来自 Moonshot AI 在 LLM 训练中的 Kimi K2 突破。该优化器带来了更高的稳定性和更快的收敛速度,将语言模型的优化进展转移到了计算机视觉领域。
这些创新共同打造了一个模型家族,在小物体检测上实现了更高的准确性,提供无缝部署,并在 CPU 上运行速度提升高达 43%—— 使 YOLO26 成为迄今为止资源受限环境中最实用、最易部署的 YOLO 模型之一。

主要特性
移除 DFL 模块
尽管分布焦点损失(DFL)模块效果显著,但它常常使导出过程复杂化并限制硬件兼容性。YOLO26 完全移除了 DFL,简化了推理过程,并扩大了对边缘和低功耗设备的支持范围。
端到端无 NMS 推理
与依赖 NMS 作为单独后处理步骤的传统检测器不同,YOLO26 是原生端到端模型。预测结果直接生成,减少了延迟,使集成到生产系统的过程更快、更轻量且更可靠。
ProgLoss + STAL
改进的损失函数提高了检测精度,特别是在小物体识别方面有显著改进,这对物联网、机器人技术、航空影像和其他边缘应用至关重要。
MuSGD 优化器
这是一种结合了 SGD 和 Muon 的新型混合优化器。灵感源自 Moonshot AI 的 Kimi K2,MuSGD 将大型语言模型(LLM)训练中的先进优化方法引入计算机视觉领域,实现了更稳定的训练和更快的收敛速度。
CPU 推理速度提升高达 43%
专为边缘计算优化,YOLO26 提供显著更快的 CPU 推理速度,确保在没有 GPU 的设备上也能实现实时性能。
支持的任务和模式
YOLO26 设计为多任务模型家族,扩展了 YOLO 在各种计算机视觉视觉挑战中的多功能性:
| Model | Task | Inference | Validation | Training | Export |
|---|---|---|---|---|---|
| YOLO26 | Detection | ✅ | ✅ | ✅ | ✅ |
| YOLO26-seg | Instance Segmentation | ✅ | ✅ | ✅ | ✅ |
| YOLO26-pose | Pose/Keypoints | ✅ | ✅ | ✅ | ✅ |
| YOLO26-obb | Oriented Detection | ✅ | ✅ | ✅ | ✅ |
| YOLO26-cls | Classification | ✅ | ✅ | ✅ | ✅ |
这个统一框架确保 YOLO26 适用于实时检测、分割、分类、姿态估计和定向目标检测等多种任务 —— 所有这些任务都支持训练、验证、推理和导出功能。
性能指标
以下基准测试结果为早期预览版本。最终数据和可下载权重将在训练完成后发布。
使用COCO数据集的检测指标:
| Model | size (pixels) | mAPval 50-95(e2e) | mAPval 50-95 | Speed CPU ONNX (ms) | Speed T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|
| YOLO26n | 640 | 39.8 | 40.3 | 38.90 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
| YOLO26s | 640 | 47.2 | 47.6 | 87.16 ± 0.9 | 2.7 ± 0.0 | 9.5 | 20.7 |
| YOLO26m | 640 | 51.5 | 51.7 | 220.0 ± 1.4 | 4.9 ± 0.1 | 20.4 | 68.2 |
| YOLO26l | 640 | 53.0* | 53.4* | 286.17 ± 2.0* | 6.5 ± 0.2* | 24.8 | 86.4 |
由于模型的快速演进特性,Ultralytics 尚未发布关于 YOLO26 的正式研究论文。
24万+

被折叠的 条评论
为什么被折叠?



