L1正则化与L2正则化详解

最新推荐文章于 2025-07-14 23:43:50 发布

原创

最新推荐文章于 2025-07-14 23:43:50 发布 · 6k 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

L1、L2正则化

什么是正则化？
L1、L2正则化公式
正则化的作用
为什么加入L1正则化的模型会更稀疏
Reference

什么是正则化？

正则化在DL、ML中的含义为，为模型取得较好的泛化性，在目标函数中添加的相应惩罚项。
通俗的来讲：
正则化的加入就是为了提高模型的表征能力与适应能力，使其不至于对训练数据集产生过拟合现象。

L1、L2正则化公式

L1正则化其就是惩罚项采用了L1范数而得名的，简单且不严谨的理解L1范数就是绝对值。
加入L1正则化之后的损失函数为：
$\hat{J}(\omega;X,y)=J(\omega;X,y)+\lambda\parallel\omega\parallel_1$
L2正则化与L1相类似，只不过是采用了L2范数，可以理解为是平方根形式的惩罚项。
加入L2正则化之后的损失函数为：
$\hat{J}(\omega;X,y)=J(\omega;X,y)+\frac{\lambda}{2}\parallel\omega\parallel^2_2$

最低0.47元/天解锁文章

新学期VIP享超值加赠

博客等级

码龄11年

79
原创

389
点赞

1134
收藏

89
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 机器学习，深度学习模型训练阶段的Shuffle重要么？为什么？

下一篇：: 什么是交叉验证(Cross Validation)？

最新评论

聚类效果评估——轮廓系数（Silhouette Coefficient）附Python代码
RealMoYe: 博主您好，“是什么”部分，分离度定义中“紧密”一词应该是“分离”？
TensorFlow1.x入门（5）——构建非线性回归模型
Drew�: np.linspace拼写错误啦，可以更正下，支持博主
机器学习，深度学习模型训练阶段的Shuffle重要么？为什么？
新一代图书管理员の养成笔记: 对NN能记住100条数据中前50条和后50条的次序区别存疑：以MLP为例，它内部不存在可以记忆时间的结构，如果前50条和后50条的信息是一模一样的，输入MLP，也将得到一模一样的结果，而如果MLP能记住“第几条数据”这个信息，则不可能得到一模一样的结果，故MLP记不住第几条数据的信息
Python中yield的作用与for循环的区别，yield关键字的白话解析
优快云-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.youkuaiyun.com/questions/8006779, 请多输出高质量博客, 帮助更多的人
机器学习，深度学习模型训练阶段的Shuffle重要么？为什么？
qiao_yx: 在处理数据集时，是否将不同类别的数据一起做shuffle或分开处理取决于具体的情况和任务要求。将所有数据一起做shuffle然后划分数据集：适用场景：当你希望保持数据的随机性，并且对类别的顺序不敏感时，可以将所有数据合并后进行shuffle，然后再划分成训练集、验证集和测试集等。示例：在一个分类任务中，如果不同类别的数据在训练集和测试集中的分布比例是一样的，那么可以将所有数据合并后进行shuffle。分开类别分别做对应的操作：适用场景：当你希望在数据集的划分或处理过程中保持类别的平衡时，可以先将不同类别的数据分开，然后分别进行shuffle和处理。示例：在一个分类任务中，如果你希望训练集和测试集中的每个类别的样本数量保持大致相等，那么可以先将数据按类别分开，然后分别shuffle，最后再合并成训练集和测试集。具体选择哪种方式取决于任务的要求和数据集的性质。在实践中，可以根据具体情况灵活选择合适的方法。无论选择哪种方式，都要保证数据集的划分和处理是公平、合理的，以保证模型训练和评估的可靠性。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。