YOLO13:基于超图增强自适应视觉感知的实时目标检测

YOLO13:基于超图增强自适应视觉感知的实时目标检测

论文:YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception

代码:https://github.com/iMoonLab/yolov13

YOLOv13主要技术

YOLOv13 新一代实时检测器,集卓越性能与效率于一身。

YOLOv13 系列包含四种变体:Nano、Small、Large 和 X-Large,其核心技术包括:

超图自适应相关增强(HyperACE)

  • 将多尺度特征图中的像素视为超图顶点。
  • 采用可学习的超边构建模块,自适应探索顶点间的高阶相关性。
  • 利用具有线性复杂度的消息传递模块,在高阶相关性的引导下有效聚合多尺度特征,实现对复杂场景的高效视觉感知。

全流程聚合-分发范式(FullPAD)

  • 使用 HyperACE 聚合主干网络的多尺度特征,并在超图空间中提取高阶相关性。

  • FullPAD 范式进一步通过三条独立通道,将这些增强相关性的特征分别传递至主干与颈部的连接层、颈部内部层以及颈部与头部的连接层,实现全流程的细粒度信息流和表征协同。

  • FullPAD 显著改善梯度传播,提升检测性能。

基于深度可分离结构的模型轻量化

  • 用基于深度可分离卷积(DSConv、DS-Bottleneck、DS-C3k、DS-C3k2)的模块替代大核卷积,在保持感受野的同时大幅减少参数和计算量。

  • 在不牺牲精度的前提下实现更快的推理速度。

主要架构

在这里插入图片描述

主要测试结果

MS COCO Benchmark

与其他先进的实时目标检测器在 MS COCO 数据集上的定量对比

Method FLOPs (G) Parameters(M) AP50:95val AP50val AP75val Latency (ms)
YOLOv6-3.0-N 11.4 4.7 37.0 52.7 2.74
Gold-YOLO-N 12.1 5.6 39.6 55.7 2.97
YOLOv8-N 8.7 3.2 37.4 52.6 40.5 1.77
YOLOv10-N 6.7 2.3 38.5 53.8 41.7 1.84
YOLO11-N 6.5 2.6 38.6 54.2 41.6 1.53
YOLOv12-N 6.5 2.6 40.1 56.0 43.4
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值