YOLO13:基于超图增强自适应视觉感知的实时目标检测
论文:YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception
代码:https://github.com/iMoonLab/yolov13
YOLOv13主要技术
YOLOv13 新一代实时检测器,集卓越性能与效率于一身。
YOLOv13 系列包含四种变体:Nano、Small、Large 和 X-Large,其核心技术包括:
超图自适应相关增强(HyperACE)
- 将多尺度特征图中的像素视为超图顶点。
- 采用可学习的超边构建模块,自适应探索顶点间的高阶相关性。
- 利用具有线性复杂度的消息传递模块,在高阶相关性的引导下有效聚合多尺度特征,实现对复杂场景的高效视觉感知。
全流程聚合-分发范式(FullPAD)
-
使用 HyperACE 聚合主干网络的多尺度特征,并在超图空间中提取高阶相关性。
-
FullPAD 范式进一步通过三条独立通道,将这些增强相关性的特征分别传递至主干与颈部的连接层、颈部内部层以及颈部与头部的连接层,实现全流程的细粒度信息流和表征协同。
-
FullPAD 显著改善梯度传播,提升检测性能。
基于深度可分离结构的模型轻量化
-
用基于深度可分离卷积(DSConv、DS-Bottleneck、DS-C3k、DS-C3k2)的模块替代大核卷积,在保持感受野的同时大幅减少参数和计算量。
-
在不牺牲精度的前提下实现更快的推理速度。
主要架构

主要测试结果
MS COCO Benchmark
与其他先进的实时目标检测器在 MS COCO 数据集上的定量对比
| Method | FLOPs (G) | Parameters(M) | AP50:95val | AP50val | AP75val | Latency (ms) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0-N | 11.4 | 4.7 | 37.0 | 52.7 | – | 2.74 |
| Gold-YOLO-N | 12.1 | 5.6 | 39.6 | 55.7 | – | 2.97 |
| YOLOv8-N | 8.7 | 3.2 | 37.4 | 52.6 | 40.5 | 1.77 |
| YOLOv10-N | 6.7 | 2.3 | 38.5 | 53.8 | 41.7 | 1.84 |
| YOLO11-N | 6.5 | 2.6 | 38.6 | 54.2 | 41.6 | 1.53 |
| YOLOv12-N | 6.5 | 2.6 | 40.1 | 56.0 | 43.4 |

最低0.47元/天 解锁文章
2733

被折叠的 条评论
为什么被折叠?



