L1和L2正则详解

zhongrui_fzr

于 2019-12-15 09:08:55 发布

阅读量1k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：机器学习算法深度学习文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ymrfzr/article/details/103545785

本文深入探讨了L1和L2正则化在机器学习中的作用，包括防止过拟合、参数稀疏性和模型解释性。L1正则化倾向于产生稀疏解，适合特征选择，而L2正则化确保模型稳定性，防止过拟合。通过优化问题、梯度和概率三个角度，解释了L1正则化实现稀疏化的原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前看过很多L1正则和L2正则分析的文章，也看了很多比较二者区别的文章，但始终没能总结成体系，写这篇文章的目的就是想总结一下关于L1正则和L2正则的分析。

正则化方法 (Regularization) 是机器学习领域中一种非常重要的技巧，它主要用来对权重系数加以约束限制，进而防止过拟合。数学上来讲，正则化即为在目标函数中加入对权值系数的约束。

首先说说使用正则化的场景：

变量较多或者样本量少于变量数的情形；
特征集合具有比较高的共线性；
寻求稀疏解（比如估计模型参数时的嵌入式特征选择）；
为了解释或寻求高维数据集中变量组合；

正则化的作用在于：

1）保证模型尽可能的简单，避免过拟合。

2）约束模型特性，加入一些先验知识，例如稀疏、低秩等。

说到正则化的作用，先要搞清楚两个问题

1）实现参数的稀疏有什么好处吗？

一个好处是可以简化模型，避免过拟合。因为一个模型中真正重要的参数可能并不多，如果考虑所有的参数起作用，那么可以对训练数据可以预测的很好，但是对测试数据就只能呵呵了。另一个好处是参数变少可以使整个模型获得更好的可解释性。

2）参数值越小代表模型越简单吗？

是的。为什么参数越小，说明模型越简单呢，这是因为越复杂的模型，越是会尝试对所有的样本进行拟合，甚至包括一些异常样本点，这就容易造成在较小的区间里预测值产生较大的波动，这种较大的波动也反映了在这个区间里的导数很大，而只有较大的参数值才能产生较大的导数。因此复杂的模型，其参数值会比较大。

了解这些前提知识以后，可以看L1和L2的区别：

L1正则化与L2正则化形式上的区别在于范数的阶。这两种正则化的主要区别在于以下几点：

解的唯一性：L2正则化具有唯一解，而L1正则化没有唯一解。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。