智能数字图像处理之FastRCNN（pytorch）代码解读之train_mobilenet.py

本文详细解读了使用PyTorch实现的FastRCNN模型，重点在于训练过程和模型构建。通过加载预训练的MobileNetV2作为backbone，配置AnchorsGenerator和MultiScaleRoIAlign，构建FasterRCNN网络。训练过程中，首先冻结backbone的参数，只训练RPN，然后逐步解冻并训练整个网络，同时应用StepLR学习率调度策略。最后，通过绘制训练损失、学习率曲线及验证集mAP变化图来监控模型性能。

首先看一下系统架构:

解读create_model方法

1.backbone = MobileNetV2(weights_path="./backbone/mobilenet_v2.pth").features-》加载MobileNetV2预训练模型
backbone.out_channels = 1280-》设置输出通道

2.anchor_generator = AnchorsGenerator(sizes=((32, 64, 128, 256, 512),),
aspect_ratios=((0.5, 1.0, 2.0),))-》调用AnchorsGenerator函数，AnchorsGenerator函数作用以后再讲，

3.roi_pooler = torchvision.ops.MultiScaleRoIAlign(featmap_names=['0'], # 在哪些特征层上进行roi 池化
output_size=[7, 7], # roi_pooling输出特征矩阵尺寸
sampling_ratio=2) # 采样率

4. model = FasterRCNN(backbone=backbone,
num_classes=num_classes,
rpn_anchor_generator=anchor_generator,
box_roi_pool=roi_pooler)-》调用faster_rcnn_framework的FasterRCNN

解读main方法：

1.device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")-》调用GPU
print(device)

2. if not os.path.exists("save_weights"):
os.makedirs("save_weights")-》检查保存权重文件夹是否存在，不存在则创建

3. data_transform = {
"train": transforms.Compose([transforms.ToTensor(),
transforms.RandomHorizontalFlip(0.5)]),
"val": transforms.Compose([transforms.ToTensor()])
}-》加载数据预处理函数

4. VOC_root = "./"
assert os.path.exists(os.path.join(VOC_root, "VOCdevkit")), "not found VOCdevkit in path:'{}'".format(VOC_root)-》加载数据集

5.train_data_set = VOC2012DataSet(VOC_root, data_transform["train"], True)-》加载训练数据
train_data_loader = torch.utils.data.DataLoader(train_data_set,
&nb