Swin-Transformer-Object-Detection环境搭建训练流程及问题

本文介绍了使用Swin-Transformer进行目标检测的环境搭建过程,包括conda虚拟环境创建、PyTorch与torchvision的安装、模型库下载以及mmdetection的安装。在实际操作中遇到的问题包括:数据集图片命名规则、类别配置、训练时的loss为nan以及demo保存图片的修改。针对这些问题,作者提供了相应的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、背景

Swin-Transformer(Swin代表移位窗口shifted window)可以作为计算机视觉的通用backbone。它的github网址是Swin-Transformer,然后它有好几种应用:

Getting Started
For Image Classification, please see get_started.md for detailed instructions.
For Object Detection and Instance Segmentation, please see *Swin Transformer for Object Detection*.
For Semantic Segmentation, please see Swin Transformer for Semantic Segmentation.
For Self-Supervised Learning, please see Transformer-SSL.
For Video Recognition, please see Video Swin Transformer.

因为这里我们主要是图像实例分割,所以用第二个Swin-Transformer-Object-Detection模型,进入网址Swin-Transformer-Object-Detection

二、流程

1.搭建环境

此次安装版本

Python 3.7
pytorch       1.10.2       py3.7_cuda11.3_cudnn8.2.0_0    pytorch

这个也是基于mm

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值