08- 算法解读 Mask R-CNN (目标检测)

本文详细介绍了MaskR-CNN的环境配置,包括Python版本、PyTorch库和pycocotools的安装。它提供了文件结构解析,预训练权重的下载链接,以及COCO2017和PascalVOC2012数据集的使用说明。文章还涵盖了训练方法,包括单GPU和多GPU训练,并给出了训练时的注意事项,如数据集路径设置和学习率调整。最后,文章讨论了Mask分支和损失函数在模型训练中的作用。

要点:

  • Mask R-CNN 解读

参考资料:vision/references/detection at main · pytorch/vision · GitHub


四 Mask R-CNN 基本信息

4.1 环境配置

  • Python3.6/3.7/3.8
  • Pytorch1.10或以上
  • pycocotools(Linux:pip install pycocotools; Windows:pip install pycocotools-windows(不需要额外安装vs))
  • 最好使用GPU训练
  • 详细环境配置见requirements.txt

4.2 文件结构

  ├── backbone: 特征提取网络
  ├── network_files: Mask R-CNN网络
  ├── train_utils: 训练验证相关模块(包括coco验证相关)
  ├── my_dataset_coco.py: 自定义dataset用于读取COCO2017数据集
  ├── my_dataset_voc.py: 自定义dataset用于读取Pascal VOC数据集
  ├── train.py: 单GPU/CPU训练脚本
  ├── train_multi_GPU.py: 针对使用多GPU的用户使用
  ├── predict.py: 简易的预测脚本,使用训练好的权重进行预测
  ├── validation.py: 利用训练好的权重验证/测试数据的COCO指标,并生成record_mAP.txt文件
  └── transforms.py: 数据预处理(随机水平翻转图像以及bboxes、将PIL图像转为Tensor)

4.3 预训练权重下载地址

(下载后放入当前文件夹中)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值