欠拟合与过拟合、正则化方法介绍

最新推荐文章于 2024-08-11 23:39:34 发布

原创最新推荐文章于 2024-08-11 23:39:34 发布 · 806 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

Deep learning 专栏收录该内容

5 篇文章

订阅专栏

本文探讨了机器学习中常见的两个问题：欠拟合和过拟合，并提出了相应的解决方案。欠拟合通常是因为模型过于简单，可以通过增加特征、转换为多项式模型或调整正则化参数来解决。而过拟合则是模型过于复杂，可以采用如正则化等方法进行缓解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 欠拟合

欠拟合一般由于选取的特征太少导致模型的表达能力差，捕捉信息能力不足，而不是说训练数据太少

解决方法：

1）添加其他特征

2）转换为多项式模型

3）当出现欠拟合时，减少正则化参数（正则化是用来防止过拟合的）。

2. 过拟合

过拟合就是模型把数据学习的太彻底，把噪声数据的特征也学习了，模型泛化能力太差。

解决方法：

1）重新清洗数据，减少噪音数据

2）增大数据的训练量，防止训练数据占总数据的比例过小。

3）采用正则化方法。

4）采用dropout方法。在训练的时候让神经元以一定的概率不工作。

3.正则化方法

正则化方法一般是在目标函数之后加上相应的范数，包括L0正则、L1正则和L2正则。

在机器学习中一般使用L2正则：

L0范数是指向量中非0的元素的个数。L1范数是指向量中各个元素绝对值之和，由于L1范数是L0范数的最优凸近似，而且它比L0范数要容易优化求解，所以L1范数更受关注。

L2范数是指向量各元素的平方和然后求平方根。更小的w意味着模型的复杂度更低，不会过分拟合训练数据，以提高模型的泛化能力。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。