拉普拉斯分布,高斯分布,L1 L2

本文探讨了机器学习中L1和L2正则化的数学原理,解释了这两种正则化方法如何通过引入不同的先验分布来防止过拟合。L1正则化基于拉普拉斯分布,而L2正则化则基于高斯分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

之前那篇文章里提到,L1其实是加上服从拉普拉斯分布的先验,L2是加上服从高斯分布的先验:

http://www.cnblogs.com/charlesblc/p/7977732.html

 

那么记住拉普拉斯的公式和高斯的公式:

 

拉普拉斯(Laplace)

 

 

高斯(Gaussian)分布

 

### L1正则化L2正则化的概念 L1正则化,也称为Lasso(Least Absolute Shrinkage and Selection Operator)正则化,通过在损失函数中添加一个模型权重绝对值成比例的惩罚项来限制模型复杂度。具体来说,L1正则化项是所有权重系数的绝对值之和,这使得某些权重在优化过程中被压缩至零,从而实现特征选择的效果[^3]。 L2正则化,又名Ridge正则化,同样是在损失函数中加入一个额外的惩罚项以控制模型复杂度。但不同于L1正则化的是,它对权重的平方进行惩罚。这意味着L2正则化不会使权重完全变为零,而是倾向于让它们趋近于零,因此它可以减少模型参数之间的差异而不至于消除任何特征的影响[^2]。 ### 在机器学习中的应用 L1正则化因其能够产生稀疏模型而广泛应用于特征选择场景中。当面对具有大量无关或冗余特征的数据集时,使用L1正则化可以帮助识别并保留那些对于预测目标最重要的特征[^1]。此外,由于其对异常值较为鲁棒的特点,在数据可能存在噪声或者离群点的情况下,L1正则化可能是一个更好的选择[^1]。 另一方面,L2正则化适用于处理多重共线性问题,即当输入变量之间存在高度相关关系时,L2正则化可以提供更稳定的结果。因为即使输入特征间有较强的关联,L2正则化仍能保持模型参数的小幅度变化,避免了因微小的数据变动而导致模型性能大幅波动的问题[^1]。 ### 区别分析 - **数学性质**:L1正则化导致了一个非连续可导的优化问题,这通常需要特殊的优化算法如坐标下降法等;而L2正则化保持了原始损失函数的光滑性,允许使用标准梯度下降方法进行求解。 - **先验分布假设**:从贝叶斯统计的角度看,L1正则化相当于给定权重一个拉普拉斯先验分布,强调稀疏性的先验信念;而L2正则化则对应着高斯先验分布,暗示权重应该集中在零附近但不必严格为零[^4]。 - **应用场景**:如果目标在于构建一个简洁且易于解释的模型,并且相信大部分特征实际上并不影响输出,则应优先考虑L1正则化。相反地,若主要关心的是提高模型泛化能力而非特征选择,并且预计到输入特征可能存在较强的相关性,则推荐采用L2正则化策略。 ```python # 示例代码展示如何在Scikit-Learn中实现带有L1/L2正则化的线性回归 from sklearn.linear_model import Lasso, Ridge from sklearn.datasets import make_regression from sklearn.model_selection import train_test_split # 生成模拟数据 X, y = make_regression(n_features=20, n_informative=5, noise=0.1) X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) # 使用L1正则化(Lasso) lasso = Lasso(alpha=0.1) # alpha 控制正则化的强度 lasso.fit(X_train, y_train) print("Lasso score:", lasso.score(X_test, y_test)) # 使用L2正则化(Ridge) ridge = Ridge(alpha=0.1) ridge.fit(X_train, y_train) print("Ridge score:", ridge.score(X_test, y_test)) ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值