YOLOv9

最新推荐文章于 2025-12-03 21:04:27 发布

原创最新推荐文章于 2025-12-03 21:04:27 发布 · 503 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #计算机视觉

部署运行你感兴趣的模型镜像

YOLOv9

YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information

keypoint:Existing methods ignore a fact that when input data undergoes layer-by-layer feature extraction and spatial transformation, large amount of information will be lost.
在这里插入图片描述

Main Contributions

programmable gradient information (PGI)
Generalized Efficient Layer Aggregation Network (GELAN)

PGI

首先需要先提理论：信息损失
直观一点：
在这里插入图片描述

概括地说：随着网络的不断加深，所提取得到的特征信息越来越语义化，越接近于下游的监督真值，信息丢失(提纯)的现象就越严重，但是作为一个主干网络或对于上游任务而言，应当不失偏颇地尽可能多地提取到图像地各种信息。
Ref：REVERSIBLE COLUMN NETWORKS(RevCol)
在这里插入图片描述

keypoints：

reversible；
Column stack

宏观来看：在这里插入图片描述

微观结构：
在这里插入图片描述

yolov9:
在这里插入图片描述

GELAN

在这里插入图片描述

Experiments

summary

在这里插入图片描述

tensorRT

在这里插入图片描述

on onnx

在这里插入图片描述

ELAN

在这里插入图片描述

PGI

在这里插入图片描述

some details

train

在这里插入图片描述

mosaic 早停
由于采用了PGI，因此不需要使用预训练模型，train-from-scratch可以获取更好的效果。
auxiliary head(from yolov7)：
yolov7:

export

Reparameterization(from yolov7)：
通过重参数化将main branch & aux branch的参数进行重组，以及最终的预测头只输出main branch的结果，从而节省计算成本
在这里插入图片描述

在yolov9的源码中，提供了三种训练方式，分别对应单独主干训练，结合一条辅助分支训练，结合两条辅助分支训练，最高使用3+3+3个检测头计算loss，对应不同尺度的网络，使用对应的权重融合策略即可，以yolov9-c为例，
remove from index 23 to index 37：
在这里插入图片描述