MMDetection项目自定义训练运行时配置详解-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00466/article/details/148359912

MMDetection项目自定义训练运行时配置详解

mmdetection open-mmlab/mmdetection: 是一个基于 PyTorch 的人工智能物体检测库，支持多种物体检测算法和工具。该项目提供了一个简单易用的人工智能物体检测库，可以方便地实现物体的检测和识别，同时支持多种物体检测算法和工具。项目地址: https://gitcode.com/gh_mirrors/mm/mmdetection

前言

在目标检测任务中，训练过程的配置对模型性能有着至关重要的影响。本文将深入讲解如何在MMDetection项目中自定义训练运行时配置，包括优化器设置、训练策略调整、训练循环定制以及钩子功能扩展等方面。

优化器配置详解

基础优化器设置

MMDetection采用OptimWrapper统一管理优化相关配置，主要包含三个核心部分：

优化器(optimizer)：定义优化算法及基础参数
参数级配置(paramwise_cfg)：针对不同参数设置差异化策略
梯度裁剪(clip_grad)：控制梯度更新幅度

典型配置示例如下：

optim_wrapper = dict(
    type='OptimWrapper',
    optimizer=dict(
        type='AdamW',
        lr=0.0001,
        weight_decay=0.05,
        eps=1e-8,
        betas=(0.9, 0.999)),
    paramwise_cfg=dict(
        custom_keys={
            'backbone': dict(lr_mult=0.1, decay_mult=1.0),
        },
        norm_decay_mult=0.0),
    clip_grad=dict(max_norm=0.01, norm_type=2))

内置优化器使用

MMDetection支持PyTorch原生所有优化器，如SGD、Adam等。切换优化器只需修改配置：

optim_wrapper = dict(
    type='OptimWrapper',
    optimizer=dict(type='Adam', lr=0.0003, weight_decay=0.0001))

自定义优化器实现

1. 创建新优化器类

在mmdet/engine/optimizers/目录下创建新文件（如my_optimizer.py）：

from mmdet.registry import OPTIMIZERS
from torch.optim import Optimizer

@OPTIMIZERS.register_module()
class MyOptimizer(Optimizer):
    def __init__(self, params, a, b, c, **kwargs):
        # 实现优化器逻辑

2. 注册优化器

有两种方式使系统识别新优化器：

在mmdet/engine/optimizers/__init__.py中添加导入
或在配置中使用custom_imports：

custom_imports = dict(
    imports=['mmdet.engine.optimizers.my_optimizer'],
    allow_failed_imports=False)

3. 配置使用

optim_wrapper = dict(
    type='OptimWrapper',
    optimizer=dict(type='MyOptimizer', a=1.0, b=0.5, c=0.1))

高级优化技巧

梯度裁剪

optim_wrapper = dict(
    _delete_=True,
    clip_grad=dict(max_norm=35, norm_type=2))

动量调度

配合学习率调度使用可加速收敛：

param_scheduler = [
    dict(
        type='CosineAnnealingLR',
        T_max=8,
        eta_min=lr*10,
        begin=0,
        end=8),
    dict(
        type='CosineAnnealingMomentum',
        T_max=8,
        eta_min=0.85,
        begin=0,
        end=8)
]

训练策略定制

学习率调度策略

MMDetection支持多种学习率调整策略：

多项式衰减策略

param_scheduler = [
    dict(
        type='PolyLR',
        power=0.9,
        eta_min=1e-4,
        begin=0,
        end=8)
]

余弦退火策略

param_scheduler = [
    dict(
        type='CosineAnnealingLR',
        T_max=8,
        eta_min=lr*1e-5,
        begin=0,
        end=8)
]

训练循环定制

基于轮次的训练循环

train_cfg = dict(
    type='EpochBasedTrainLoop',
    max_epochs=12,
    val_begin=1,
    val_interval=1)

基于迭代的训练循环

支持动态验证间隔：

train_cfg = dict(
    type='IterBasedTrainLoop',
    max_iters=368750,
    val_interval=5000,
    dynamic_intervals=[(365001, 368750)])

钩子机制深入

自定义钩子实现

1. 创建新钩子类

from mmengine.hooks import Hook
from mmdet.registry import HOOKS

@HOOKS.register_module()
class MyHook(Hook):
    def __init__(self, a, b):
        pass
    
    def before_train_iter(self, runner, batch_idx, data_batch):
        # 训练迭代前逻辑

2. 注册与使用

custom_hooks = [
    dict(type='MyHook', a=1.0, b=2.0, priority='NORMAL')
]

内置钩子配置

检查点钩子

default_hooks = dict(
    checkpoint=dict(
        type='CheckpointHook',
        interval=1,
        max_keep_ckpts=3))

日志钩子

default_hooks = dict(
    logger=dict(type='LoggerHook', interval=50))

可视化钩子

default_hooks = dict(
    visualization=dict(type='DetVisualizationHook', draw=True))

vis_backends = [
    dict(type='LocalVisBackend'),
    dict(type='TensorboardVisBackend')
]
visualizer = dict(
    type='DetLocalVisualizer',
    vis_backends=vis_backends,
    name='visualizer')