DETR训练自己的数据集

最新推荐文章于 2025-09-26 04:24:07 发布

原创最新推荐文章于 2025-09-26 04:24:07 发布 · 1.3w 阅读

72 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #计算机视觉 #深度学习

深度学习同时被 2 个专栏收录

24 篇文章

订阅专栏

pytorch

11 篇文章

订阅专栏

该博客详细介绍了如何使用Facebook Research的DETR（DEtection TRansformer）模型进行对象检测。首先，通过conda创建虚拟环境并安装必要的库。接着，克隆DETR代码库并安装依赖。然后，将数据集转换为COCO格式，或者使用提供的脚本将VOC数据集转换。之后，调整预训练模型以适应目标类别的数量，并进行训练。最后，提供训练和推理的命令，并展示了如何利用plot_utils.py绘制精度召回曲线和日志图表。

部署运行你感兴趣的模型镜像

github地址：https://github.com/facebookresearch/detr

1.创建conda环境

推荐通过conda创建虚拟环境，具体操作可见linux系统下创建anaconda新环境及问题解决

2.clone代码并安装依赖库

git clone https://github.com/facebookresearch/detr.git

conda install -c pytorch pytorch torchvision
conda install cython scipy
pip install -U 'git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI'
pip install git+https://github.com/cocodataset/panopticapi.git

3.准备自己的数据集

使用COCO格式数据集，其文件目录如下：
其中，annotations包含训练集和验证集对应的json文件
train2017包含训练集图片；val2017包含验证集图片
※如果事先准备好了VOC格式的数据集，则可通过脚本进行转换，详见VOC格式数据集转为COCO格式数据集脚本

4.下载预训练模型并修改类别参数

创建一个python文件，根据自己的目标类别数目对原始用于coco数据集的预训练模型进行转换

import torch

pretrained_weights = torch.load("./detr-r50-e632da11.pth")

num_class = 2 + 1
pretrained_weights["model"]["class_embed.weight"].resize_(num_class+1,256)
pretrained_weights["model"]["class_embed.bias"].resize_(num_class+1)

torch.save(pretrained_weights,'detr_r50_%d.pth'%num_class)

更改detr.py中的目标类别数目（这里干脆都改成一样的了）

5.训练

运行main.py并传递相应的参数进行训练

python main.py --dataset_file "coco" --coco_path /path/to/coco/ --resume="detr_r50_3.pth"

6.推理

同样运行main.py 需要--eval及其它相关参数

7.plot

借助plot_utils.py，在文件末尾添加下方代码，更改路径并运行即可。

if __name__ == '__main__':
    files = list(Path('../outputs/eval').glob('*.pth'))
    plot_precision_recall(files)
    plt.show()
    plot_logs(logs=Path('../outputs/log/'),fields=('class_error', 'loss_bbox_unscaled', 'mAP'), ewm_col=0, log_name='log.txt')
    plt.show()

参考链接：
https://blog.youkuaiyun.com/w1520039381/article/details/118905718

您可能感兴趣的与本文相关的镜像

ACE-Step

音乐合成

ACE-Step

ACE-Step是由中国团队阶跃星辰（StepFun）与ACE Studio联手打造的开源音乐生成模型。它拥有3.5B参数量，支持快速高质量生成、强可控性和易于拓展的特点。最厉害的是，它可以生成多种语言的歌曲，包括但不限于中文、英文、日文等19种语言

14 条评论

咻咻的棒棒糖 2024.07.04
size mismatch for class_embed.weight: copying a param with shape torch.Size([3, 256]) from checkpoint, the shape in current model is torch.Size([2, 256]). size mismatch for class_embed.bias: copying a param with shape torch.Size([3]) from checkpoint, the shape in current model is torch.Size([2]). 博主出现这个情况怎么办呀

麦田里的捡穗狗 2024.04.21
我训练结束以后没有生成log文件夹啊只有eval文件夹

紫日_CL 2023.04.15
plot的时候出现 precision = data['precision'] KeyError: 'precision' 是什么原因？

迪迦特奥曼 2022.12.13
博主！求翻牌！最后的plot部分，可以画训练损失曲线嘛！怎么弄呀！救救孩子吧
- � may回复迪迦特奥曼 2023.07.09
  您用什么软件画的训练损失曲线呢
- 键盘手123回复迪迦特奥曼 2023.01.10
  同问，而且我的log不是一个文件夹只有一个文件

木崽 2022.05.18
请问还有其他需要调整的参数么，感觉mAP训练结果才刚刚40多，不是很理想。

wan.J 2022.05.11
修改预训练文件那里，上面numclass已经加1了，后面权重那里怎么又加1了？
- 2301_81354270回复wan.J 2023.12.29
  同问，我也有这个疑惑

_无名之辈 2022.04.26
AssertionError: provided COCO path \path\to\coco does not exist 我在运行main.py报这个错是啥意思鸭
- cc__cc__回复weixin_46560310 2022.04.26
  下载之后不会显示路径吗？另外你是要对预训练权重进行修改吗？
- weixin_46560310回复cc__cc__ 2022.04.26
  您好作者大大，detr我在colab下载并运行官方代码，它都是直接联网下载权重，我应该去哪里找加载的预训练权重并进行修改呢比较小白求不要见怪
- _无名之辈回复cc__cc__ 2022.04.26
  看到了，谢谢你作者大大
- cc__cc__回复_无名之辈 2022.04.26
  换成你数据集的路径