08- 算法解读 Mask R-CNN (目标检测)

最新推荐文章于 2025-05-26 17:07:00 发布

原创

最新推荐文章于 2025-05-26 17:07:00 发布 · 720 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #cnn #深度学习 #计算机视觉

本文详细介绍了MaskR-CNN的环境配置，包括Python版本、PyTorch库和pycocotools的安装。它提供了文件结构解析，预训练权重的下载链接，以及COCO2017和PascalVOC2012数据集的使用说明。文章还涵盖了训练方法，包括单GPU和多GPU训练，并给出了训练时的注意事项，如数据集路径设置和学习率调整。最后，文章讨论了Mask分支和损失函数在模型训练中的作用。

要点：

Mask R-CNN 解读

参考资料：vision/references/detection at main · pytorch/vision · GitHub

四 Mask R-CNN 基本信息

4.1 环境配置

Python3.6/3.7/3.8
Pytorch1.10或以上
pycocotools(Linux:pip install pycocotools; Windows:pip install pycocotools-windows(不需要额外安装vs))
最好使用GPU训练
详细环境配置见requirements.txt

4.2 文件结构

├── backbone: 特征提取网络
├── network_files: Mask R-CNN网络
├── train_utils: 训练验证相关模块（包括coco验证相关）
├── my_dataset_coco.py: 自定义dataset用于读取COCO2017数据集
├── my_dataset_voc.py: 自定义dataset用于读取Pascal VOC数据集
├── train.py: 单GPU/CPU训练脚本
├── train_multi_GPU.py: 针对使用多GPU的用户使用
├── predict.py: 简易的预测脚本，使用训练好的权重进行预测
├── validation.py: 利用训练好的权重验证/测试数据的COCO指标，并生成record_mAP.txt文件
└── transforms.py: 数据预处理（随机水平翻转图像以及bboxes、将PIL图像转为Tensor）

4.3 预训练权重下载地址

（下载后放入当前文件夹中）

Resnet50 预训练权重 https://download.pytorch.org/models/resnet50-0676ba61.pth (注意，下载预训练权重后要重命名，比如在train.py中读取的是resnet50.pth文件，不是resnet50-0676ba61.pth)
Mask R-CNN(Resnet50+FPN) 预训练权重 https://download.pytorch.org/models/maskrcnn_resnet50_fpn_coco-bf2d0c1e.pth (注意，载预训练权重后要重命名，比如在train.py中读取的是maskrcnn_resnet50_fpn_coco.pth文件，不是maskrcnn_resnet50_fpn_coco-bf2d0c1e.pth)