正则化，L1，L2

最新推荐文章于 2025-08-20 22:56:05 发布

weixin_30919919

最新推荐文章于 2025-08-20 22:56:05 发布

阅读量78

点赞数

CC 4.0 BY-SA版权

文章标签：人工智能

原文链接：http://www.cnblogs.com/yeran/p/10517812.html

本文探讨了机器学习中过拟合问题及其解决方法，详细解析了L1和L2正则化的作用机制，包括它们如何通过约束参数来提高模型的泛化能力，以及各自在特征选择和权重调整方面的独特优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习中在为了减小loss时可能会带来模型容量增加，即参数增加的情况，这会导致模型在训练集上表现良好，在测试集上效果不好，也就是出现了过拟合现象。为了减小这种现象带来的影响，采用正则化。正则化，在减小训练样本误差的同时，限制参数的增长，限制参数过多或者过大，从而提高模型的泛化性。

1. L1 正则化

L1 正则化公式也很简单，直接在原来的损失函数基础上加上权重参数的绝对值：

2. L2 正则化

L2 正则化公式非常简单，直接在原来的损失函数基础上加上权重参数的平方和：

L1范式和L2范式的区别

(1) L1范式是对应参数向量绝对值之和

(2) L1范式具有稀疏性

(3) L1范式可以用来作为特征选择，并且可解释性较强（这里的原理是在实际Loss function 中都需要求最小值，根据L1的定义可知L1最小值只有0，故可以通过这种方式来进行特征选择）

(4) L2范式是对应参数向量的平方和，再求平方根

(5) L2范式是为了防止机器学习的过拟合，提升模型的泛化能力

L2正则对应的是加入2范数，使得对权重进行衰减，从而达到惩罚损失函数的目的，防止模型过拟合。保留显著减小损失函数方向上的权重，而对于那些对函数值影响不大的权重使其衰减接近于0。相当于加入一个gaussian prior。
L1正则对应得失加入1范数，同样可以防止过拟合。它会产生更稀疏的解，即会使得部分权重变为0，达到特征选择的效果。相当于加入了一个laplacean prior。

转载于:https://www.cnblogs.com/yeran/p/10517812.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。