标签平滑(Label Smoothing)
标签平滑(Label Smoothing)是一种正则化技术,旨在防止模型过度自信地预测某一类别,从而提高模型的泛化能力。标签平滑通过将目标标签的硬标签(one-hot 编码)替换为软标签(soft label),使得模型在训练时对预测结果更加不确定。
标签平滑的原理
在标准的分类任务中,目标标签通常采用 one-hot 编码的形式。例如,对于三类分类问题,类别为 2 的 one-hot 标签表示为 [ 0 , 0 , 1 ] [0, 0, 1] [0,0,1]。在标签平滑中,这些 one-hot 标签被替换为软标签。例如,使用标签平滑值 ϵ l s = 0.1 \epsilon_{ls} = 0.1 ϵls=0.1,one-hot 标签 [ 0 , 0 , 1 ] [0, 0, 1] [0,0,1]将被替换为 [ 0.033 , 0.033 , 0.933 ] [0.033, 0.033, 0.933] [0.033,0.033,0.933],具体公式如下:
y s m o o t h = y o n e − h o t ⋅ ( 1 − ϵ l s ) + ϵ l s K y_{smooth} = y_{one-hot} \cdot (1 - \epsilon_{ls}) + \frac{\epsilon_{ls}}{K} ysmooth=yone−hot⋅(1−