什么是warm-up
在网络学习的初期,我们会将学习率会是一个非常小的值,然后再慢慢地增长到我们设定的初始的学习率,然后再将学习率按照我们正常的学习过程慢慢地降低。前期学习率从非常小的值到我们设定的学习率的值的过程我们称之为“warm-up”

为什么要设置warm-up?
主要是为了解决初始学习率过大导致训练不稳定问题。
文章介绍了warm-up在初始阶段逐渐增加学习率的方法,以防止因过大数据导致的训练不稳定性。主要目标是平稳过渡至正常学习过程。
在网络学习的初期,我们会将学习率会是一个非常小的值,然后再慢慢地增长到我们设定的初始的学习率,然后再将学习率按照我们正常的学习过程慢慢地降低。前期学习率从非常小的值到我们设定的学习率的值的过程我们称之为“warm-up”

主要是为了解决初始学习率过大导致训练不稳定问题。
4万+
3386
1119

被折叠的 条评论
为什么被折叠?