DeepLabv3+训练细节总结

最新推荐文章于 2025-09-04 11:20:44 发布

原创

最新推荐文章于 2025-09-04 11:20:44 发布 · 2.6k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#DeepLab

本文详细总结了DeepLabv3+的训练协议，包括使用ResNet-101或修改后的Xception，基于ImageNet-1K预训练，在PASCAL VOC 2012数据集上进行训练。采用了'poly'学习率策略，初始学习率为0.007，并使用了513×513的输入尺寸。在验证集上，模型以8的 atrous rate 进行推理，以获取更详细的特征图。训练过程中还涉及了数据增强，如图像缩放和随机左右翻转。

Training Protocol

backbone: ResNet-101 or modified aligned Xception
pretrain: ImageNet-1K
dataset: PASCAL VOC 2012 (20 foreground object classes, 1 background class)
10582 (trainaug) training images, 1449 (val), 1456 (test)
lr schedule: “poly” policy (initial lr: 0.007)
initial learning rate is multiplied by $(1−itermax_iter)power(1-\frac{iter}{max\_iter})^{power}$