RepOptimizers: 优化器的创新重构 (ICLR 2023)-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00095/article/details/139542373

RepOptimizers: 优化器的创新重构 (ICLR 2023)

RepOptimizersOfficial repo of RepOptimizers and RepOpt-VGG项目地址:https://gitcode.com/gh_mirrors/re/RepOptimizers

在机器学习领域，优化器是模型训练过程中的关键组件，它们控制着参数更新的过程。RepOptimizers 是一项在 ICLR 2023 上接受的创新性工作，它提出了重新参数化优化器的概念，而非仅仅调整网络架构。这个开源项目不仅提供了可复现的代码，还通过实验验证了新方法的有效性，并已被应用于YOLOv6 和YOLOv7 中。

项目介绍

RepOptimizers 包含了一套针对两种基本更新规则（SGD 带动量和 AdamW）以及两种模型（RepOpt-VGG 和 RepOpt-GhostNet）的重参数化优化器实现。通过将模型特定行为与优化器逻辑分离，该框架允许开发者以一种灵活且可验证的方式应用结构性重参数化。

项目技术分析

该项目的核心在于其设计思路，它提供了一个脚本来演示在SGD和AdamW中GR（Grad Mults）等于CSLA（Consistent Scale Layer Assignment）的等价性。优化器部分由两个主要模块组成：

模型：如 repoptvgg_model.py 和 repoptghostnet_model.py 定义了目标结构和搜索结构。
模型特定处理程序：RepOptimizerHandler 根据所搜索到的尺度执行模型特定的行为，包括初始化规则和迭代时的梯度乘法计算。

此外，repoptimizer_sgd.py 和 repoptimizer_adamw.py 实现了基于不同更新规则的 RepOptimizers，它们接收并存储 Grad Mults，然后在step函数中正确地使用这些值进行参数更新。

应用场景

RepOptimizers 已被用于预训练模型 RepOpt-VGG 的训练和评估，其准确性和效率在ImageNet-1K数据集上得到了验证。除此之外，它们也被应用于轻量级模型 RepGhostNet，展示出了高效能的特征。这些模型可以轻松地集成到其他项目中，例如YOLO系列检测器，以提升性能或减少内存占用。