rtmdet_mmcv在各种应用场景中实现了最佳参数精度权衡且在实时实例分割和旋转目标检测方面获得了最新的性能

RTMDet

论文

RTMDet: An Empirical Study of Designing Real-Time Object Detectors
论文链接

模型结构

RTMDet 将 CSPDarkNet 作为基线,并使用同样构建单元组成的 CSPPAFPN 进行多尺度的特征融合,最后将特征输入给不同的检测头,进行目标检测、实例分割和旋转框检测等任务

算法原理

宏观架构与yolo系列没有太大的区别,主要增加了构建基本单元的特征提取能力以及弹错模型不同的组件件的计算效率和精度平衡 对构建单元进行了更新

环境配置

Docker(方法一)

docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.8
docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video -v /opt/hyhal:/opt/hyhal:ro --name docker_name imageID bash
cd /path/workspace/
pip install mmdet==3.2.0 -i https://mirrors.aliyun.com/pypi/simple/

Dockerfile(方法二)

cd ./docker
docker build --no-cache -t mmdet:3.0 .
docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video -v /opt/hyhal:/opt/hyhal:ro --name docker_name imageID bash
cd /path/workspace/

Anaconda(方法三)

1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装: https://developer.hpccube.com/tool/

DTK软件栈: dtk24.04.1
python: python3.8
torch: 2.1.0
torchvision: 0.16.0+das1.1.git7d45932.abi1.dtk2404.torch2.1
mmcv: 2.0.1+das1.1.gite58da25.abi1.dtk2404.torch2.1.0

Tips:以上dtk软件栈、python、torch、mmcv等DCU相关工具版本需要严格一一对应

2、其他非特殊库直接按照requirements.txt安装

cd workspace/
pip install mmdet==3.2.0 -i https://mirrors.aliyun.com/pypi/simple/

数据集

COCO2017(在网络良好的情况下,如果没有下载数据集,程序会默认在线下载数据集)

训练数据

验证数据

测试数据

标签数据

数据集的目录结构如下:

├── images 
│   ├── train2017
│   ├── val2017
│   ├── test2017
├── labels
│   ├── train2017
│   ├── val2017
├── annotations
│   ├── instances_val2017.json
├── LICENSE
├── README.txt 
├── test-dev2017.txt
├── train2017.txt
├── val2017.txt

训练

  • 数据集放置位置默认为当前目录下 data/
  • 如需要变更数据集目录 请修改 configs/_base_/datasets/coco_detection.py 下的 data_root
bash ./train.sh

推理

# 官方推理代码
python demo/image_demo.py demo/demo.jpg ./configs/rtmdet/rtmdet_s_8xb32-300e_coco.py --weights rtmdet_s_8xb32-300e_coco_20220905_161602-387a891e.pth --device cuda

result

精度

模型名称batchsizeamp混精精度
rtmdet-s256off44.5
rtmdet-s256on44.5

应用场景

算法类别

目标检测

热点应用行业

金融,交通,教育

源码仓库及问题反馈

参考资料

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

技术瘾君子1573

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值