7、深度学习模型训练技巧与数据增强策略-优快云博客

本文链接：https://blog.youkuaiyun.com/seed/article/details/155184138

深度学习模型训练技巧与数据增强策略

1. 学习率优化：差分学习率

在模型训练中，学习率是一个关键的超参数。通常，我们会为整个模型应用一个统一的学习率。但在迁移学习中，采用差分学习率（Differential Learning Rates）往往能提升模型的准确性。

1.1 调整优化器

首先，重新初始化所选的优化器，并传入从学习率查找图中确定的学习率。以ResNet - 50模型为例，我们可以修改优化器来设置不同层的学习率：

optimizer = optimizer.Adam([
    {'params': transfer_model.layer4.parameters(), 'lr': found_lr / 3},
    {'params': transfer_model.layer3.parameters(), 'lr': found_lr / 9},
], lr=found_lr)

上述代码将 layer4 （分类器前一层）的学习率设置为找到的学习率的三分之一， layer3 的学习率设置为九分之一。不过，这只是经验值，你可以根据实际情况进行调整。

1.2 解冻预训练层

在之前的训练中，我们冻结了所有预训练层。虽然为这些层设置了不同的学习率，但由于它们不累积梯度，模型训练不会对其进行更新。因此，我们需要解冻这些层：

unfreeze_layers = [transfer_model