【机器学习】过拟合问题

最新推荐文章于 2024-12-17 16:43:05 发布

原创最新推荐文章于 2024-12-17 16:43:05 发布 · 391 阅读

1 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

9 篇文章

订阅专栏

本文探讨了过拟合的概念及其在线性回归和逻辑回归中的表现。解决过拟合的方法主要包括减少参数和正则化，重点介绍了L2正则化，其通过在目标函数中添加惩罚项来防止过拟合。调整λ值是关键，过大可能导致欠拟合，过小则可能过拟合。正则化后的线性回归和逻辑回归的梯度下降公式也进行了展示。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

欠拟合(Underfitting)也叫高偏差，是指我们的假设模型与训练样本之间的映射效果不好，通常可能的原因是模型太简单，或者我们所用到的参数太少。
另一个极端过拟合(Overfitting)是指与训练样本拟合地非常好，但是却对新数据的预测效果不好。可能的原因是我们选择了过于复杂的模型。
下面用Andrew Ng的两幅图来表示欠拟合和过拟合在线性回归和逻辑回归中的效果：
在这里插入图片描述

那么如何解决过拟合问题呢？主要有两种方法：
第一种，减少多余的参数。
第二种，正则化(Regularization)。
我们主要讲一下正则化。正则化方法是指向原始模型引入额外的信息，以便防止过拟合的一类方法的统称。一般分为L1正则化和L2正则化。本文讲的是L2正则化方法。
L2正则化是指在目标函数 $J(θ)J(\theta)$ 后加一个惩罚项，使得权重更加接近于原点。
具体公式为:
$J(\theta)=\frac{1}{2m}[\sum_{i=1}^{m}Cost(h_\theta(x^{(i)}),y^{(i)})+\lambda\sum_{j=1}^n\theta^2_j]$
其中 $λ∑j=1nθj2\lambda\sum_{j=1}^n\theta^2_j$ 为惩罚项。
需要注意的是 $θ0\theta_0$ 不应该被加入到惩罚项中，因为 $θ0\theta_0$ 并没有乘以实际的样本特征。在实际的过程中，需要注意如和调节 $λ\lambda$ 值的大小，如果 $λ\lambda$ 值过大，可能会出现欠拟合的情况，如果 $λ\lambda$ 值过小，则有可能出现过拟合的情况。