MEGA.pytorch 项目使用教程-优快云博客

MEGA.pytorch 项目使用教程

mega.pytorch Memory Enhanced Global-Local Aggregation for Video Object Detection, CVPR2020 项目地址: https://gitcode.com/gh_mirrors/me/mega.pytorch

1. 项目介绍

MEGA.pytorch 是一个用于视频对象检测的 PyTorch 实现项目，由 Yihong Chen、Yue Cao、Han Hu 和 Liwei Wang 开发。该项目基于 maskrcnn_benchmark，实现了 "Memory Enhanced Global-Local Aggregation for Video Object Detection" 方法，该方法在 CVPR 2020 中被接受。

MEGA.pytorch 不仅实现了 MEGA 方法，还包含了其他几种算法，如 FGFA 和 RDN。项目欢迎新的方法贡献，并希望通过这个仓库促进视频对象检测领域的进一步研究。

2. 项目快速启动

安装

首先，克隆项目到本地：

git clone https://github.com/Scalsol/mega.pytorch.git
cd mega.pytorch

然后，按照 INSTALL.md 文件中的说明进行安装。

数据准备

下载 ILSVRC2015 DET 和 ILSVRC2015 VID 数据集，并将其路径符号链接到 datasets/ 目录下。路径结构应如下：

/datasets/ILSVRC2015/
/datasets/ILSVRC2015/Annotations/DET
/datasets/ILSVRC2015/Annotations/VID
/datasets/ILSVRC2015/Data/DET
/datasets/ILSVRC2015/Data/VID
/datasets/ILSVRC2015/ImageSets

训练

使用以下命令在 4 个 GPU 上训练 MEGA_R_101_FPN_1x：

python -m torch.distributed.launch \
    --nproc_per_node=4 \
    tools/train_net.py \
    --master_port=$((RANDOM + 10000)) \
    --config-file configs/MEGA/vid_R_101_C4_MEGA_1x.yaml \
    --motion-specific \
    OUTPUT_DIR training_dir/MEGA_R_101_1x

推理

使用以下命令在验证数据集上进行推理：

python -m torch.distributed.launch \
    --nproc_per_node 4 \
    tools/test_net.py \
    --config-file configs/MEGA/vid_R_101_C4_MEGA_1x.yaml \
    --motion-specific \
    MODEL.WEIGHT MEGA_R_101.pth