9月25日,在伦敦举行的年度混合活动 YOLO Vision 2025(YV25)上,Ultralytics 创始人兼 CEO Glenn Jocher 正式发布了 Ultralytics YOLO 系列模型的最新突破性成果——Ultralytics YOLO26!这款全新的计算机视觉模型采用了精简的架构,在速度、准确性和部署便捷性之间实现了完美平衡,能够高效地分析和理解图像与视频内容。
尽管 Ultralytics YOLO26 在设计上进行了简化并引入了多项新改进,但它依然延续了用户熟悉的 YOLO 模型特性。例如,YOLO26 易于使用,支持多种计算机视觉任务,并提供灵活的集成与部署选项。
毫无疑问,这将使迁移到 YOLO26 变得轻松无忧。我们迫不及待地想看到用户在十月底模型正式开放使用后,亲自体验它的强大功能。

图1:使用 YOLO26 检测图像中的物体示例。
简而言之,Ultralytics YOLO26 是一款更优秀、更快速、更轻量的视觉 AI 模型。在本文中,我们将深入探讨 YOLO26 的核心特性及其带来的价值。让我们开始吧!
用 Ultralytics YOLO26 推动视觉 AI 的边界
在深入了解 YOLO26 的关键特性及其应用之前,让我们先回顾一下开发这一模型的初衷与动力。
Ultralytics 始终坚信创新的力量。从一开始,我们的使命就是双重的:一方面,我们希望让视觉 AI 对所有人无障碍可用;另一方面,我们也致力于将其推向技术前沿,突破计算机视觉模型的极限。
推动这一使命的一个关键因素是 AI 领域的持续演进。例如,边缘 AI(即在设备本地运行 AI 模型,而非依赖云端)正在各行各业迅速普及。
从智能摄像头到自动驾驶系统,边缘设备如今都需要实时处理信息。这一趋势要求模型在保持高准确率的同时,更加轻量和快速。
这正是我们不断改进 Ultralytics YOLO 模型的原因所在。正如 Glenn Jocher 所说:“最大的挑战之一是确保用户能够充分发挥 YOLO26 的潜力,同时依然保持顶尖性能。”
Ultralytics YOLO26 概览
YOLO26 提供五种不同的模型变体,开箱即用,赋予用户在不同规模应用中灵活使用的能力。
所有这些变体都支持多种计算机视觉任务,就像之前的 YOLO 模型一样。无论你选择哪种规模,都可以依赖 YOLO26 提供广泛的功能,类似于 Ultralytics YOLO11。
以下是 YOLO26 支持的计算机视觉任务概览:
-
目标检测:识别并定位图像或视频帧中的多个物体。
-
实例分割:在检测基础上进一步生成每个物体的像素级边界。
-
图像分类:分析整张图像并将其归类到特定标签。
-
姿态估计:检测关键点并估计人体或其他物体的姿态。
-
旋转边界框(OBB):检测任意角度的物体,特别适用于航拍、无人机和卫星图像。
-
目标追踪:在视频帧或实时流中追踪物体。

图2:使用 YOLO26 检测图像中的物体。
YOLO26 架构亮点
在了解了 YOLO26 的功能之后,让我们来看看其架构中的一些创新。
模型设计通过移除 Distribution Focal Loss(DFL)模块 实现简化,该模块曾拖慢推理速度并限制边界框回归性能。
预测过程也通过引入 端到端(E2E)推理选项 得到简化,使模型可以跳过传统的 非极大值抑制(NMS) 步骤。这一改进降低了复杂度,使模型能更快地输出结果,便于在实际应用中部署。
其他改进使模型更智能、更可靠:渐进式损失平衡(ProgLoss) 有助于稳定训练并提升准确率;小目标感知标签分配(STAL) 确保模型能更有效地检测小物体;此外,全新的 MuSGD 优化器 提升了训练收敛速度和整体性能。
事实上,YOLO26 的最小版本——nano 模型,在标准 CPU 上的运行速度提升了 43%,非常适合移动应用、智能摄像头和其他对速度和效率要求极高的边缘设备。
以下是 YOLO26 的核心特性总结:
-
移除 DFL 模块:无论图像中物体大小如何,YOLO26 都能精准绘制边界框,同时运行更高效。
-
端到端无 NMS 推理:新增可选模式,跳过传统 NMS 步骤,使部署更简单、实时性更强。
-
ProgLoss 与 STAL:提升训练稳定性与准确率,尤其在复杂场景中的小目标检测方面表现更佳。
-
MuSGD 优化器:结合 Muon 与 SGD 的优势,加快学习速度并提升模型精度。

图3:YOLO26 的性能基准测试。
使用 Ultralytics YOLO26 简化部署
无论你是开发移动应用、智能摄像头还是企业级系统,部署 YOLO26 都非常简单灵活。
Ultralytics Python 包 支持不断增长的导出格式,使 YOLO26 能轻松集成进现有工作流,并兼容几乎所有平台。
部分导出选项包括:
-
TensorRT:最大化 GPU 加速性能
-
ONNX:广泛兼容
-
CoreML:适用于 iOS 原生应用
-
TFLite:适用于 Android 和边缘设备
-
OpenVINO:在英特尔硬件上优化性能
这种灵活性使 YOLO26 从开发到生产的过渡更加顺畅,无需额外障碍。
部署中的另一个关键点是确保模型在资源受限设备上高效运行。这正是量化技术大显身手的地方。得益于其简化架构,YOLO26 在量化方面表现优异。
它支持 INT8 部署(通过 8 位压缩减小模型体积并提升速度,仅损失极少精度),以及 半精度(FP16) 推理,在支持的硬件上实现更快推理。
最重要的是,YOLO26 在这些量化级别上都能保持一致的性能表现,无论运行在强大的服务器还是紧凑的边缘设备上,都能可靠工作。
从机器人到制造业:YOLO26 的应用场景
YOLO26 可广泛应用于多个行业的计算机视觉任务,从机器人到制造业,都能通过优化工作流程、提升决策速度与准确性,带来显著影响。
例如,在机器人领域,YOLO26 可帮助机器人实时理解周围环境,使导航更顺畅、物体抓取更精准,并实现更安全的人机协作。
在制造业中,YOLO26 可用于缺陷检测,比人工检测更快、更准确地识别生产线上的产品瑕疵。

图4:在制造工厂中使用 YOLO26 检测瓶子。
总体而言,凭借更优、更快、更轻的特性,YOLO26 可轻松适应从轻型边缘设备到大型企业系统的多种环境,是希望提升效率、准确性与可靠性的行业的实用之选。
核心要点总结
Ultralytics YOLO26 是一款更优秀、更快速、更轻量的计算机视觉模型,依然易于使用并保持强劲性能。它支持多种任务和平台,将于十月底正式向所有人开放。我们迫不及待地想看到社区如何利用它创造新方案,推动计算机视觉的边界。
相关链接:
https://docs.ultralytics.com/zh/models/yolo26/
https://www.ultralytics.com/blog/meet-ultralytics-yolo26-a-better-faster-smaller-yolo-model

2831

被折叠的 条评论
为什么被折叠?



