YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information Chien-Yao Wang1,2, I-Hau Yeh2, and Hong-Yuan Mark Liao1,2,3 1Institute of Information Science, Academia Sinica, Taiwan 2National Taipei University of Technology, Taiwan 3Department of Information and Computer Engineering, Chung Yuan Christian University, Taiwan arXiv:2402.13616v1 [cs.CV] 21 Feb 2024 kinyiu@iis.sinica.edu.tw, ihyeh@emc.com.tw, and liao@iis.sinica.edu.tw
正文如下:
如今的深度学习⽅法重点关注如何设计最合适的⽬标 函数,使得模型的预测结果能够最接近真实情况。同时, 必须设计⼀个适当的架构,可以帮助获取⾜够的信息进⾏ 预测。现有⽅法忽略了⼀个事实,即当输⼊数据经过逐层 特征提取和空间变换时,⼤量信息将会丢失。本⽂将深⼊ 研究数据通过深度⽹络传输时数据丢失的重要问题,即信 息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI) 的概念来应对深度⽹络实现多个⽬标所需的各种变化。 PGI可以为⽬标任务计算⽬标函数提供完整的输⼊信息, 从⽽获得可靠的梯度信息来更新⽹络权值。此外,还设计 了⼀种基于梯度路径规划的新型轻量级⽹络架构——通⽤⾼效层聚合⽹络(GELAN)。GELAN的架构证实了PGI在 轻量级模型上取得了优异的结果。我们在基于 MS COCO 数据集的⽬标检测上验证了所提出的 GELAN 和 PGI。结果表明,与基于深度卷积开发的最先进⽅法相⽐, GELAN 仅使⽤传统的卷积算⼦即可实现更好的参数利⽤ 率。PGI 可⽤于从轻型到⼤型的各种模型。它可以⽤来获 取完整的信息,使得train-fromscratch模型能够⽐使⽤⼤

最低0.47元/天 解锁文章
1316

被折叠的 条评论
为什么被折叠?



