GroupMixFormer安装与使用指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01194/article/details/142247658

GroupMixFormer安装与使用指南

GroupMixFormer GroupMixAttention and GroupMixFormer 项目地址: https://gitcode.com/gh_mirrors/gr/GroupMixFormer

项目介绍

GroupMixFormer 是一个先进的视觉Transformer框架，它引入了Group-Mix Attention (GMA)，一种创新的自我注意机制替代方案。GMA旨在同时捕获令牌间以及不同令牌组间的关联，允许不同的组大小，从而提升了表示能力。该框架在图像分类、对象检测和语义分割等领域展现出卓越性能，且拥有比现有模型更少的参数。例如，GroupMixFormer-L在没有外部数据的情况下，在ImageNet-1K上达到了86.2%的Top-1精度。

项目快速启动

环境搭建

首先，创建并激活一个新的Conda虚拟环境：

conda create -n groupmixformer python=3.8 -y
conda activate groupmixformer

然后，安装必要的软件包，包括PyTorch、torchvision和其他依赖项：

pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html
pip install timm==0.4.12 tensorboardX six tensorboard ipdb yacs tqdm fvcore

克隆项目仓库并安装额外的依赖：

git clone https://github.com/AILab-CVC/GroupMixFormer.git
cd GroupMixFormer
pip install -r requirements.txt

注意：对于下游任务，如对象检测或语义分割，可能需要mmdetection和mmsegmentation库。

训练示例

训练GroupMixFormer-Small模型于ImageNet-1k：

python3 -m torch.distributed.launch --nproc_per_node 8 --nnodes 1 --use_env train.py \
--data-path <你的数据路径> \
--batch-size 64 \
--output <目标输出路径> \
--cfg ./configs/groupmixformer_small.yaml \
--model-type groupmixformer \
--model-file groupmixformer.py \
--tag groupmixformer_small

或者，使用提供的脚本简化操作：

bash launch_scripts/run_train.sh

应用案例与最佳实践

图像分类

要评估训练后的GroupMixFormer-Small模型：

CUDA_VISIBLE_DEVICES=1 OMP_NUM_THREADS=1 python3 -m torch.distributed.launch --nproc_per_node 1 --nnodes 1 --use_env test.py \
--data-path <你的数据路径> \
--batch-size 64 \
--output <你的输出路径> \
--cfg ./configs/groupmixformer_small.yaml \
--model-type groupmixformer \
--model-file groupmixformer.py \
--tag groupmixformer_small