L1正则化产生稀疏的权值,自动进行特征选择,去掉些没用的特征,也就是将它们的权重设为0;
L2正则化产生平滑的权值,功能是为了防止过拟合,当要求参数越小时,说明模型越简单,而模型越简单,则越趋向于平滑,从而防止过拟合。
比如w1等于0,那么w1对预测结果就没有作用了。
正则化力度大则参数趋于0,力度小则参数变化小(高阶项权重没变)
L1正则化产生稀疏的权值,自动进行特征选择,去掉些没用的特征,也就是将它们的权重设为0;
L2正则化产生平滑的权值,功能是为了防止过拟合,当要求参数越小时,说明模型越简单,而模型越简单,则越趋向于平滑,从而防止过拟合。
比如w1等于0,那么w1对预测结果就没有作用了。
正则化力度大则参数趋于0,力度小则参数变化小(高阶项权重没变)