PyTorch Scheduler动态调整学习率

本文介绍了如何在PyTorch中利用内置的lr_scheduler模块动态调整学习率,包括使用官方提供的各种预定义调度器如StepLR、CosineAnnealingLR等,以及如何自定义函数实现特定的学习率衰减策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PyTorch动态调整学习率

深度学习中长久以来一直存在一个令人困扰的问题,那就是如何选择适当的学习率。如果学习速率设置得过小,会导致模型收敛速度缓慢,训练时间延长;而如果学习率设置得太大,可能会导致参数在最优解附近来回波动。然而,即使我们选定了一个合适的学习率,在经过多轮训练后,仍可能出现准确率的震荡或损失不再下降等情况,这表明当前的学习率已经不能满足模型调优的需求。在这种情况下,我们可以采用适当的学习率衰减策略来改善模型的性能,从而提高精度。这种策略在PyTorch中被称为调度器(scheduler)。

1.使用官方scheduler

PyTorch已经封装了一些动态调整学习率的方法,这些方法位于torch.optim.lr_scheduler模块中,下面列出了其中一些常用的scheduler:

这些 scheduler 都是继承自_LRScheduler类。可以通过help(torch.optim.lr_scheduler)来查看这些类的具体使用方法,也可以通过help(torch.optim.lr_scheduler._LRScheduler)来查看_LRScheduler类的具体使用方法。

# 选择一种优化器
optimizer = torch.optim.Adam(...) 
# 选择上面提到的一种或多种动态调整学习率的方法
scheduler1 = torch.optim.lr_scheduler...
scheduler2 = torch.optim.lr_scheduler...
...
schedulern = torch.optim.lr_scheduler...

# 进行训练
for epoch in range(100):
    train(...)
    validate(...)
    optimizer.step()
    
# 需要在优化器参数更新之后再动态调整学习率
# scheduler的优化是在每一轮后面进行的
scheduler1.step() 
...
schedulern.step()

:在使用官方给出的torch.optim.lr_scheduler时,需要将scheduler.step()放在optimizer.step()后面进行使用。

2.自定义scheduler

自定义 scheduler 方法是:自定义函数adjust_learning_rate来改变param_grouplr的值。

假设现在正在做实验,需要学习率每30轮下降为原来的1/10,假设已有的官方API中没有符合我们需求的,那就需要自定义函数来实现学习率的改变。

def adjust_learning_rate(optimizer, epoch):
    lr = args.lr * (0.1 ** (epoch // 30))
    for param_group in optimizer.param_groups:
        param_group['lr'] = lr

有了adjust_learning_rate函数的定义,在训练的过程就可以调用adjust_learning_rate函数来实现学习率的动态变化。

optimizer = torch.optim.SGD(model.parameters(),lr = args.lr,momentum = 0.9)
for epoch in range(100):
    train(...)
    validate(...)
    adjust_learning_rate(optimizer,epoch)

参考

深入浅出PyTorch-动态调整学习率

😃😃😃

### 学习率调度器的用法与配置 学习率调度器(Scheduler)是深度学习训练过程中的重要工具之一,其主要功能在于动态调整优化器的学习率,从而提升模型的收敛速度、稳定性以及最终性能。以下是关于如何使用和配置学习率调度器的具体说明。 #### 1. 配置基本参数 在 PyTorch 中,`StepLR` 是一种常见的学习率调度器,它的核心参数包括 `step_size` 和 `gamma`。 - 参数 `step_size` 控制每隔多少个 epoch 调整一次学习率[^4]。 - 参数 `gamma` 则定义了每次调整学习率的衰减比例。 例如,在初始化 `StepLR` 调度器时可以这样设置: ```python import torch.optim as optim optimizer = optim.SGD(model.parameters(), lr=0.01) scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=20, gamma=0.8) ``` 上述代码表示每经过 20 个 epoch 后,当前学习率将以 0.8 的倍数递减。 --- #### 2. 动态更新学习率 为了使学习率随训练进程变化,需在每个 epoch 结束后调用调度器的 `.step()` 方法来触发学习率的变化: ```python for epoch in range(num_epochs): train_model() # 训练模型逻辑 validate_model() # 验证模型逻辑 scheduler.step() # 更新学习率 ``` 通过这种方式,可以在不同阶段自动调节学习率,满足不同的训练需求[^2]。 --- #### 3. 更复杂的调度策略 除了简单的步进式调度外,PyTorch 还提供了其他多种类型的调度器以适应更多场景的需求。下面列举几种常用的方法及其特点: ##### (1) **ExponentialLR** 指数方式降低学习率,适合希望平滑减少学习率的情况。 ```python scheduler = optim.lr_scheduler.ExponentialLR(optimizer, gamma=0.9) ``` 这里 `gamma` 定义了每次迭代后的学习率缩放因子。 ##### (2) **ReduceLROnPlateau** 基于验证指标的表现决定是否降低学习率,适用于需要监控特定条件下的情况。 ```python scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10) ``` 此方法会在验证损失不再下降的情况下逐渐缩小学习率。 ##### (3) **CosineAnnealingLR** 采用余弦退火的方式改变学习率,有助于探索更大的超参空间。 ```python scheduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=50) ``` 其中 `T_max` 表示周期长度。 --- #### 4. 自定义调度器 如果内置选项无法完全匹配具体应用场景,则可以通过继承 `torch.optim.lr_scheduler._LRScheduler` 类来自定义调度行为。例如: ```python class CustomScheduler(optim.lr_scheduler._LRScheduler): def __init__(self, optimizer, last_epoch=-1): super(CustomScheduler, self).__init__(optimizer, last_epoch) def get_lr(self): return [base_lr * math.pow(0.95, self.last_epoch) for base_lr in self.base_lrs] # 初始化自定义调度器 custom_scheduler = CustomScheduler(optimizer) ``` 这种灵活性允许开发者针对特殊任务设计专属方案[^3]。 --- ### 总结 合理运用学习率调度器能够显著改善深度学习模型的训练表现。无论是基础的固定间隔调整还是高级的动态响应机制,都应依据实际项目背景选取最合适的策略[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值