pytorch框架学习（12）——学习率调整策略-优快云博客

本文链接：https://blog.youkuaiyun.com/aidanmo/article/details/104361193

本文详述了PyTorch中六种学习率调整策略：StepLR、MultiStepLR、ExponentialLR、CosineAnnealingLR、ReduceLROnPlateau及LambdaLR。涵盖了从固定间隔调整到自适应调整，再到自定义策略的全面指南。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

1. pytorch的六种学习率调整策略
2. 学习率调整小结

1. pytorch的六种学习率调整策略

class _LRScheduler
- 主要属性：
  - optimizer：关联的优化器
  - last_epoch：记录epoch数
  - base_lrs：记录初试学习率
- 主要方法：
  - step（）：更新下一个epoch的学习率
  - get_lr()：虚函数，计算下一个epoch的学习率
1.StepLR
- 功能：等间隔调整学习率
- 主要参数：
  - step_size：调整间隔数
  - gamma：调整系数
- 调整方式：lr = lr * gamma
2.MultiStepLR
- 功能：按给定间隔调整学习率
- 主要参数：
  - milestones：设定调整时刻数
  - gamma：调整系数
- 调整方式：lr = lr * gamma

milestones = [50, 125, 160]
scheduler_lr = optim.lr_scheduler.MultiStepLR(optimizer, milestones, gamma=0.1)

3.ExponentialLR
- 功能：按指数衰减调整学习率
- 主要参数：
  - gamma：指数的底(通常会设定为一个接近1的数)
- 调整方式：lr = lr * gamma ** epoch

gamma = 0.95
scheduler_lr = optim.lr_scheduler.ExponentialLR(optimizer, gamma=gamma)

在这里插入图片描述

4.CosineAnnealingLR
- 功能：余弦周期调整学习率
- 主要参数：
  - T_max：下降周期
  - eta_min：学习率下限（通常设置为0）
- 调整方式：

t_max = 50
scheduler_lr = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=t_max, eta_min=0.)

在这里插入图片描述

5.ReduceLRonPlateau
- 功能：监控指标，当指标不再变化则调整
- 主要参数：
  - mode：min/max两种模式
  - factor：调整系数
  - patience：“耐心”，接受几次不变化
  - cooldown：“冷却时间”，停止监控一段时间
  - verbose：是否打印日志
  - min_lr：学习率下限
  - eps：学习率衰减最小值

loss_value = 0.5
accuray = 0.9

factor = 0.1
mode = "min"
patience = 10
cooldown = 10
min_lr = 1e-4
verbose = True

scheduler_lr = optim.lr_scheduler.ReduceLROnPlateau(optimizer, factor=factor, mode=mode, patience=patience, cooldown=cooldown, min_lr=min_lr, verbose=verbose)

for epoch in range(max_epoch):
    for i in range(iteration):

        # train(...)

        optimizer.step()
        optimizer.zero_grad()

    scheduler_lr.step(loss_value)	# 监控的指标

6.LambdaLR
- 功能：自定义调整策略
- 主要参数：
  - lr_lambda：function or list

lr_init = 0.1

weights_1 = torch.randn((6, 3, 5, 5))
weights_2 = torch.ones((5, 5))

optimizer = optim.SGD([
    {'params': [weights_1]},
    {'params': [weights_2]}], lr=lr_init)

lambda1 = lambda epoch: 0.1 ** (epoch // 20)
lambda2 = lambda epoch: 0.95 ** epoch

scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=[lambda1, lambda2])

lr_list, epoch_list = list(), list()
for epoch in range(max_epoch):
    for i in range(iteration):

        # train(...)

        optimizer.step()
        optimizer.zero_grad()

    scheduler.step()

    lr_list.append(scheduler.get_lr())
    epoch_list.append(epoch)

    print('epoch:{:5d}, lr:{}'.format(epoch, scheduler.get_lr()))

plt.plot(epoch_list, [i[0] for i in lr_list], label="lambda 1")
plt.plot(epoch_list, [i[1] for i in lr_list], label="lambda 2")
plt.xlabel("Epoch")
plt.ylabel("Learning Rate")
plt.title("LambdaLR")
plt.legend()
plt.show()