MMPretrain项目中的模型命名与配置规范解析-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00271/article/details/148574880

MMPretrain项目中的模型命名与配置规范解析

在深度学习项目中，统一的命名规范对于项目维护和团队协作至关重要。MMPretrain作为计算机视觉领域的深度学习框架，建立了一套完善的模型命名与配置规范体系。本文将深入解析这套规范的设计理念和具体规则，帮助开发者更好地理解和使用MMPretrain框架。

MMPretrain采用五段式命名结构，各部分间用下划线'_'连接，同一部分内的单词用连字符'-'连接：

{算法信息}_{模块信息}_{预训练信息}_{训练信息}_{数据信息}

这部分标识模型使用的主要训练算法，常见于自监督学习或特定训练方法的模型：

描述模型的核心架构，必须包含主干网络(backbone)信息：

记录预训练模型的关键信息，以-pre结尾：

示例组合：clip-openai-pre、mae-in21k-pre

详细记录训练配置，格式为{硬件配置}-{训练技巧}-{调度策略}-{训练时长}：

完整示例：8xb256-amp-coslr-300e

描述训练数据集和输入尺寸：

vit-base-p32_clip-openai-pre_3rdparty_in1k

beit_beit-base-p16_8xb256-amp-coslr-300e_in1k

配置文件命名与模型命名基本一致，但有两点区别：

必须包含完整的训练信息，不能使用3rdparty
仅包含主干网络的配置文件添加_headless后缀，如：
- resnet50_headless.py
- vit-base-p16_headless.py

权重文件命名包含模型名、日期和哈希值：

{模型名称}_{日期}-{哈希值}.pth

示例：resnet50_20230215-abcd1234.pth

通过这套规范体系，MMPretrain实现了模型管理的标准化，大大提高了项目的可维护性和协作效率。理解并正确应用这些规范，将帮助开发者更好地参与项目开发和模型共享。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考