要点:
- Mask R-CNN 解读
参考资料:vision/references/detection at main · pytorch/vision · GitHub
四 Mask R-CNN 基本信息
4.1 环境配置
- Python3.6/3.7/3.8
- Pytorch1.10或以上
- pycocotools(Linux:
pip install pycocotools; Windows:pip install pycocotools-windows(不需要额外安装vs)) - 最好使用GPU训练
- 详细环境配置见
requirements.txt
4.2 文件结构
├── backbone: 特征提取网络
├── network_files: Mask R-CNN网络
├── train_utils: 训练验证相关模块(包括coco验证相关)
├── my_dataset_coco.py: 自定义dataset用于读取COCO2017数据集
├── my_dataset_voc.py: 自定义dataset用于读取Pascal VOC数据集
├── train.py: 单GPU/CPU训练脚本
├── train_multi_GPU.py: 针对使用多GPU的用户使用
├── predict.py: 简易的预测脚本,使用训练好的权重进行预测
├── validation.py: 利用训练好的权重验证/测试数据的COCO指标,并生成record_mAP.txt文件
└── transforms.py: 数据预处理(随机水平翻转图像以及bboxes、将PIL图像转为Tensor)
4.3 预训练权重下载地址
(下载后放入当前文件夹中)
-
Resnet50 预训练权重 https://download.pytorch.org/models/resnet50-0676ba61.pth (注意,下载预训练权重后要重命名, 比如在train.py中读取的是
resnet50.pth文件,不是resnet50-0676ba61.pth) -
Mask R-CNN(Resnet50+FPN) 预训练权重 https://download.pytorch.org/models/maskrcnn_resnet50_fpn_coco-bf2d0c1e.pth (注意, 载预训练权重后要重命名,比如在train.py中读取的是
maskrcnn_resnet50_fpn_coco.pth文件,不是maskrcnn_resnet50_fpn_coco-bf2d0c1e.pth)

本文详细介绍了MaskR-CNN的环境配置,包括Python版本、PyTorch库和pycocotools的安装。它提供了文件结构解析,预训练权重的下载链接,以及COCO2017和PascalVOC2012数据集的使用说明。文章还涵盖了训练方法,包括单GPU和多GPU训练,并给出了训练时的注意事项,如数据集路径设置和学习率调整。最后,文章讨论了Mask分支和损失函数在模型训练中的作用。
最低0.47元/天 解锁文章
2292

被折叠的 条评论
为什么被折叠?



