机器学习03——线性回归过拟合正则化 L1L2正则 岭回归 Lasso回归 弹性网络

本文深入探讨了线性回归中的过拟合问题,介绍了防止过拟合的正则化方法,包括岭回归、Lasso回归和弹性网络。通过实例解释了L1和L2正则化的差异,并提供了选择正则化参数的建议。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最小二乘回归中,目标函数只考虑了模型对训练样本的拟合程度:在这里插入图片描述

原则上任意复杂的模型能完全拟合训练数据。我们称之为过拟合。

• 过拟合( overfitting ):过于复杂的模型与训练数据拟合得太好,但和测试数据拟合得不好。
• 欠拟合(underfitting):过于简单的模型与训练数据拟合得欠佳(和测试数据自然也拟合得不好)

注意:线性回归中采用线性模型。而线性模型是很简单的模型,所以当特征维数不是太高时,线性回归的过拟合现象通常不太严重。

举例说明:

sin曲线拟合

在这里插入图片描述
在这里插入图片描述
上图可以看到,绿色正弦曲线为真实值,蓝色圆点为模拟数据集。
红色曲线为在不同阶多项式的情况下,拟合的效果。
可以看到,阶数越多,对于数据集的拟合效果越好,但是不一定与真实值越接近。

我们另外生成100个数据作为测试集,检验模型:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值