MMTracking项目配置文件系统详解-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01064/article/details/148552947

MMTracking项目配置文件系统详解

mmtracking OpenMMLab Video Perception Toolbox. It supports Video Object Detection (VID), Multiple Object Tracking (MOT), Single Object Tracking (SOT), Video Instance Segmentation (VIS) with a unified framework. 项目地址: https://gitcode.com/gh_mirrors/mm/mmtracking

配置文件系统概述

MMTracking作为计算机视觉中视频目标跟踪领域的强大工具，其配置文件系统采用了模块化和继承的设计理念，使得研究人员和开发者能够高效地进行各种实验配置。本文将深入解析MMTracking的配置文件系统，帮助用户更好地理解和使用这一重要功能。

配置文件基础操作

查看完整配置

MMTracking提供了便捷的工具来查看完整的配置信息。通过运行以下命令，用户可以查看经过所有继承和修改后的最终配置：

python tools/print_config.py /PATH/TO/CONFIG

这个功能特别有用，当你想确认最终的配置是否如预期时，可以避免逐层检查继承关系的麻烦。

运行时修改配置

在实际使用中，我们经常需要在训练或测试时临时修改某些配置参数，而不想修改原始的配置文件。MMTracking提供了灵活的--cfg-options参数来实现这一需求：

修改字典键值：可以直接按照配置文件中字典键的顺序修改选项。例如：
```
--cfg-options model.detector.backbone.norm_eval=False
```
这个命令会将模型骨干网络中的BN模块从评估模式改为训练模式。
修改列表中的字典：对于配置中的列表项（如数据处理流水线），可以通过索引来修改特定位置的字典。例如：
```
--cfg-options data.test.pipeline.0.type=LoadImageFromWebcam
```
这个命令将流水线中的第一个操作从"从文件加载图像"改为"从摄像头加载图像"。
修改列表/元组值：当需要修改列表或元组类型的配置时，需要使用引号包裹整个表达式。例如：
```
--cfg-options workflow="[(train,1),(val,1)]"
```
注意引号内不允许有空格，这是为了保证参数解析的正确性。

配置文件结构设计

基础组件

MMTracking的配置文件系统建立在三个核心基础组件之上：

数据集配置(dataset)：定义数据加载、预处理和增强策略
模型配置(model)：定义网络结构、损失函数等模型相关参数
运行时配置(default_runtime)：定义训练策略、优化器、日志等运行时参数

这些基础组件位于config/_base_目录下，通过组合这些组件可以构建出各种跟踪算法的配置。这种设计极大地提高了配置的复用性和可维护性。

继承机制

MMTracking推荐使用继承的方式来创建新的配置文件：

基础配置(Primitive)：每个算法文件夹下应该有一个基础配置，它由_base_中的组件组合而成
派生配置：其他配置应该从这个基础配置继承，最多支持3级继承

例如，如果你想基于Faster R-CNN进行修改，可以这样继承：

_base_ = '../../_base_/models/faster_rcnn_r50_dc5.py'

然后在配置文件中只修改必要的字段，而不是复制整个配置。

对于全新的算法，建议在configs下创建新的文件夹，如xxx_rcnn，然后按照相同的模式组织配置。

配置文件命名规范

MMTracking采用了一套清晰的配置文件命名规范，便于快速识别配置内容：

{model}_[model setting]_{backbone}_{neck}_[norm setting]_[misc]_[gpu x batch_per_gpu]_{schedule}_{dataset}

各部分的含义如下：

{model}：必填，模型类型，如dff、tracktor、siamese_rpn等
[model setting]：可选，模型特定设置，如faster_rcnn
{backbone}：必填，主干网络，如r50(ResNet-50)、x101(ResNeXt-101)
{neck}：必填，模型颈部结构，如fpn、c5
[norm_setting]：可选，标准化设置，如gn(Group Normalization)、syncbn(Synchronized Batch Normalization)
[misc]：可选，其他设置/插件，如dconv、gcb、attention
[gpu x batch_per_gpu]：可选，GPU数量和每GPU样本数，默认为8x2
{schedule}：必填，训练时长，如4e、7e、20e(20个周期)
{dataset}：必填，数据集名称，如imagenetvid、mot17、lasot

高级配置技巧

忽略基础配置字段

有时我们需要完全覆盖基础配置中的某些字段，而不是继承它们。这时可以使用_delete_=True参数：

ref_img_sampler = dict(
    _delete_=True,
    num_ref_imgs=14,
    frame_range=[-7, 7],
    method='test_with_adaptive_stride')

这个设置会删除基础配置中对应的字段，并用新定义的配置完全替换它。

中间变量的使用

配置文件中经常使用中间变量来提高可读性和维护性，如train_pipeline/test_pipeline。在修改这些中间变量时，需要特别注意：

首先定义新的中间变量
然后将其显式地赋给相应的配置字段

例如，修改SELSA的ref_img_sampler：

_base_ = ['./selsa_faster_rcnn_r50_dc5_1x_imagenetvid.py']

ref_img_sampler = dict(
    _delete_=True,
    num_ref_imgs=14,
    frame_range=[-7, 7],
    method='test_with_adaptive_stride')
    
data = dict(
    val=dict(ref_img_sampler=ref_img_sampler),
    test=dict(ref_img_sampler=ref_img_sampler))

这种显式的赋值确保了修改能够正确应用到配置中。