机器学习----过拟合和欠拟合 实例+效果图详解

本文介绍了机器学习中常见的过拟合和欠拟合现象。过拟合表现为模型过于复杂,过度捕捉数据噪声,而欠拟合则是因为模型过于简单,无法充分表达数据关系。通过线性回归和多项式回归的实例,展示了不同情况下的拟合效果。高阶多项式可能导致过拟合,降低模型的泛化能力。理想的模型应该具备良好的泛化能力,能够对新数据做出准确预测。评估模型泛化能力的方法是使用训练数据拟合模型,然后用测试数据进行验证。

前言

使用多项式回归 可能出现的问题:过拟合和欠拟合

过拟合(Over Fitting):算法所训练的模型过多的表达了数据间的噪音关系 。

就是太过于细节了!

欠拟合(Under Fitting):算法所训练的模型不能完全表述数据关系。

就是太笼统了!

上手实践

线性回归:

x=np.random.uniform(-3,3,size=100) #生成x特征 -3到3  100个
X=x.reshape(-1,1)#将x编程100行1列的矩阵
y=0.5*x**2+x+2+np.random.normal(0,1,size=100)#模拟的是标记y  对应的是x的二次函数

#使用线性回归看下score
from sklearn.linear_model import LinearRegression
reg=LinearRegression()
reg.fit(X,y)
reg.score(X,y)

#将预测值y_pre画图 对比真实y
y_pre=reg.predict(X)
plt.scatter(x,y)
plt.plot(np.sort(x),y_pre[np.argsort(x)],color='r')

#查看MSE
from sklearn.metrics import mean_squared_error
mean_squared_error(y,y_pre)

线性回归score:

0.5029149851435246

拟合效果图   此时曲线过于简单就是欠拟合

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值