Pytorch faster rcnn模型调用和调整

Pytorch Faster R-CNN模型快速使用与调整
本文介绍了如何在Pytorch中快速调用和调整Faster R-CNN模型,通过Kaggle上大神的代码示例,演示了两种调整方法:1) 直接使用预训练模型并修改类别数目;2) 自定义backbone模型。讨论了模型的内部构造,包括FastRCNNPredictor类的参数调整,并建议读者在深入研究前阅读Faster R-CNN的原始论文。

github上的项目太庞大了

最近我在做目标检测比赛,因为是小比赛并且对模型和训练时间有限制,所以我懒得在GitHub上下载faster-rcnn项目自己安装,调试,debug。有一说一,我确实在GitHub上下载了几个开源项目,但是它们太大了,我无从下手。

下载–打开–看到几十行import–关闭

GitHub上开源项目基本上都是默认你是Linux系统,它的一套流程都是在Linux安装实现的。原谅我没钱,与Linux无缘。
在windows上我只能Download ZIP,然后就出现了开头那一幕。

在kaggle上看到了一个大神的代码

Kaggle上有免费的云服务器可以跑程序,训模型。从三天前接触到kaggle,到今天点开大神的notebook好像发现了新大陆。
大神的代码如下

model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True)

直接调出模型,在创建数据集之后可以用模型直接训练数据。与上文中提到的巨型项目的差距挺大,但我现在还不明白这是为什么,两极分化?可能大项目是面向应用的吧。
由于调用了预训练模型,模型参数是根据预训练的数据集调整的。接下来就得自己跟数据集调整模型了。

有两种调整方法

1.接上面的代码

上面大神的代码直接用了Resnet50作为backbone网络,因为这是pytorch预训练好的模型,我们只需要调整一下类别数目就行了,就是number class。

in_features = model.roi_heads.box_predictor.cls_score.in_features
model.roi_heads.box_predictor = FastRCNNPredictor(in_features, 2)

我看了pytorch的文档才弄明白,第一行进入到模型内部调出了模型默认的
FastRCNNPredictor()类的参数。因为要修改类别数目,而类别数目是这个类定义的,它要输入两个参数,其中一个就是类别数目。这个就我们自己定义,但是还有一个参数我们不能自己定义啊。这个参数要根据模型定义所以我们进入模型内部调出in_feature参数。
之后我们有了in_feature和number_class,就可以使用FastRCNNPredictor()类来重新调整我们的类别数目了。第二行代码就是在模型里重新定义了FastRCNNPredictor()类。可以看出,输入的的两个参数一个是in_feature另一个是2也就是我们自己数据集的类别,分别是物体和背景两类。
之后就可以直接model(image,lebel)了。
pyto

### 使用PyTorch实现Faster R-CNN并针对自定义数据集进行训练 #### 准备工作环境 为了确保开发环境配置正确,建议按照官方文档中的指导来设置必要的软件包库。对于ruotianluo在GitHub上维护的PyTorch版本Faster R-CNN项目来说,可以通过克隆其仓库获取最新的源代码,并依据给定的要求安装所需的Python库[^1]。 ```bash git clone https://github.com/ruotianluo/pytorch-faster-rcnn.git cd pytorch-faster-r-cnn pip install -r requirements.txt ``` #### 构建自定义数据集 当考虑使用个人定制的数据集时,需遵循特定格式以便于被算法识别处理。通常情况下,这涉及到创建类似于Pascal VOC或COCO标准标注文件以及相应的图像集合。具体操作可以参照网络上的教程,这些资料会详细介绍如何构建适合用于训练的目标检测数据集[^2]。 #### 修改配置参数适应新数据集 为了让模型能够理解新的类别信息其他特性,在调整超参数之前还需要修改一些默认设定以匹配所使用的数据集特点。比如更改`classes`列表中包含的对象名称、更新输入图片尺寸等重要属性。这部分改动往往位于项目的配置文件内或是通过命令行选项完成。 #### 开始训练过程 一旦完成了上述准备工作之后就可以启动实际的训练流程了。一般而言,执行训练脚本前要指定好保存权重的位置以及其他可能影响实验结果的关键因素。下面给出了一段简单的调用样例: ```python import torch from model.faster_rcnn import resnet from datasets.pascal_voc import VOCDetection from utils.config import cfg, cfg_from_file cfg_from_file('experiments/cfgs/faster_rcnn.yml') dataset = VOCDetection(cfg.DATA_DIR, image_set='trainval') dataloader = torch.utils.data.DataLoader(dataset, batch_size=1) model = resnet(resnet=True) if args.cuda: model.cuda() for epoch in range(max_epochs): for step, data in enumerate(dataloader): im_data = data[0].cuda() if args.cuda else data[0] im_info = data[1].cuda() if args.cuda else data[1] gt_boxes = data[2].cuda() if args.cuda else data[2] num_boxes = data[3].cuda() if args.cuda else data[3] model.zero_grad() rois, cls_prob, bbox_pred, rpn_loss_cls, rpn_loss_box, RCNN_loss_cls, RCNN_loss_bbox, rois_label \ = model(im_data, im_info, gt_boxes, num_boxes) loss = rpn_loss_cls.mean() + rpn_loss_box.mean() \ + RCNN_loss_cls.mean() + RCNN_loss_bbox.mean() loss.backward() optimizer.step() ``` 这段代码展示了基本的训练循环逻辑,其中包含了加载数据、初始化模型、计算损失函数值及其反向传播等一系列核心步骤[^3]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值