机器学习——正则化

my1_1my

于 2024-12-02 22:05:30 发布

阅读量624

点赞数 7

分类专栏：机器学习文章标签：机器学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_64254014/article/details/144199138

版权

机器学习专栏收录该内容

3 篇文章

订阅专栏

正则化（Regularization）简介

在机器学习中，正则化是用来防止模型过拟合的一种方法。通过向模型的损失函数中加入一个正则项（也叫惩罚项），约束模型的复杂度，使其更具泛化能力。

为什么需要正则化？

过拟合（Overfitting）：
- 训练集的误差很小，但在测试集上的表现较差。
- 通常是因为模型过于复杂，过度拟合训练数据的噪声或细节。
正则化的作用：
- 限制模型的自由度（降低复杂度）。
- 让模型更加平滑，从而提升对未见数据的泛化能力。

样例

下面是加入正则项的损失函数

$loss_{r}=loss_{f}+\lambda w_{3}^{2}+\lambda w_{4}^{2}$

要是的损失函数最小，就需要使 w1,w2 变得无穷小，以满足 $loss_{r}$ 最小

$w_{3}x^{3}\rightarrow 0$

$w_{4}x^{4}\rightarrow 0$

最后使得模型等同于上图第一个模型

常见的正则化方法

1. L1 正则化（Lasso Regularization）

定义：在损失函数中加入参数绝对值的和作为正则项：
特点：
- 能将某些特征的权重缩小到 0，从而实现特征选择。
- 更适合用于稀疏数据或希望简化模型的场景。

2. L2 正则化（Ridge Regularization）

定义：在损失函数中加入参数平方和作为正则项：
特点：
- 不会强制权重为零，而是让权重更趋向于较小值。
- 常用于回归模型（如 Ridge Regression）中。

3. Elastic Net 正则化

定义：同时结合 L1 和 L2 的正则化形式：
特点：
- 结合了 L1 和 L2 的优点。
- 在稀疏数据和多重共线性场景下效果更好。

4. Dropout（丢弃法）

原理：在训练时，随机丢弃神经网络中的一部分神经元（即将部分输出设为 0）。
特点：
- 防止深度神经网络过拟合。
- 增强网络的鲁棒性，相当于对多个子模型进行集成。

正则化中的关键参数

正则化强度 (λ\lambdaλ)：
- 控制正则化项的影响力。
- λ\lambdaλ 太大：模型可能欠拟合。
- λ\lambdaλ 太小：正则化效果不足，可能过拟合。
- 通常通过交叉验证选择最优 λ\lambdaλ。
选择正则化方法：
- 数据稀疏：优先选择 L1 或 Elastic Net。
- 数据规模大，特征较多：优先选择 L2。

总结

正则化是控制模型复杂度、防止过拟合的核心技术。根据具体任务需求，可以选择 L1、L2、Elastic Net、Dropout 或其他正则化方法来提升模型的泛化能力。

博客等级

码龄4年

37
原创

295
点赞

211
收藏

483
粉丝

关注

私信

热门文章

分类专栏

DDPM
深度学习 3篇
机器学习 3篇
笔记 1篇
CTF 1篇

展开全部收起

上一篇：: 高斯（正态）分布

下一篇：: 机器学习随机森林算法

最新评论

解决burpsuite无法拦截dvwa靶场的问题
my1_1my: 这应该是你个人的dvwa存在问题
解决burpsuite无法拦截dvwa靶场的问题
acdcs: 使用本地地址之后，dvwa链接不到数据库了
Python记录-字典
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
算法-训练
优快云-Ada助手: 恭喜您发布了第19篇博客！不断学习和分享算法相关的知识，对自己的成长是非常有益的。希望您能继续坚持下去，不断提升自己的写作水平和算法知识。或许在下一篇博客中，可以分享一些实际应用场景下的算法案例，让读者更直观地了解算法在实践中的应用。期待您的下一篇作品！
利用哈希表和前缀和的题目它来了
优快云-Ada助手: 恭喜您撰写了第20篇博客！利用哈希表和前缀和的题目确实是一个很有挑战性的话题，您的文章内容相当有深度和独到见解。希望您能继续保持创作的热情和积极性，探索更多有趣的题材，让读者们能够从您的博客中获得更多启发和收获。期待您的下一篇作品！愿您在创作的道路上不断进步，谦虚谨慎，持之以恒。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。