什么是参数正则化
训练模型时,在原来的损失函数后,添加模型的复杂度。
Lossnew=minimize(Loss(Data|Model))+λ complex(Model)Lossnew=minimize(Loss(Data|Model))+λ complex(Model)
一般我们使用L2L2正则化:
L2=||w||22=Σnn=1w2iL2=||w||22=Σn=1nwi2
为什么引入参数正则化
防止过拟合现象:
图中的Training Data的损失越来越小,但是Validation Data的损失却越来越大,因此产生了过拟合现象。使用正则化,可以减轻过拟合的现象,这与模型的复杂度和λλ有关。
λλ数值过小,可能引发过拟合;过大会可能引发欠拟合。