机器学习----过拟合和欠拟合实例+效果图详解

过拟合与欠拟合：实例解析与解决策略

最新推荐文章于 2025-06-24 22:47:22 发布

卷曲的葡萄藤

最新推荐文章于 2025-06-24 22:47:22 发布

阅读量1w

点赞数 6

CC 4.0 BY-SA版权

分类专栏： Machine Learning

本文链接：https://blog.youkuaiyun.com/weixin_39043567/article/details/91985617

本文介绍了机器学习中常见的过拟合和欠拟合现象。过拟合表现为模型过于复杂，过度捕捉数据噪声，而欠拟合则是因为模型过于简单，无法充分表达数据关系。通过线性回归和多项式回归的实例，展示了不同情况下的拟合效果。高阶多项式可能导致过拟合，降低模型的泛化能力。理想的模型应该具备良好的泛化能力，能够对新数据做出准确预测。评估模型泛化能力的方法是使用训练数据拟合模型，然后用测试数据进行验证。

前言

使用多项式回归可能出现的问题：过拟合和欠拟合

过拟合（Over Fitting）：算法所训练的模型过多的表达了数据间的噪音关系。

就是太过于细节了！

欠拟合（Under Fitting）：算法所训练的模型不能完全表述数据关系。

就是太笼统了！

上手实践

线性回归：

x=np.random.uniform(-3,3,size=100) #生成x特征 -3到3  100个
X=x.reshape(-1,1)#将x编程100行1列的矩阵
y=0.5*x**2+x+2+np.random.normal(0,1,size=100)#模拟的是标记y  对应的是x的二次函数

#使用线性回归看下score
from sklearn.linear_model import LinearRegression
reg=LinearRegression()
reg.fit(X,y)
reg.score(X,y)

#将预测值y_pre画图 对比真实y
y_pre=reg.predict(X)
plt.scatter(x,y)
plt.plot(np.sort(x),y_pre[np.argsort(x)],color='r')

#查看MSE
from sklearn.metrics import mean_squared_error
mean_squared_error(y,y_pre)

线性回归score：