线性回归【机器学习算法一广义线性模型2】

最新推荐文章于 2024-08-06 00:50:44 发布

原创最新推荐文章于 2024-08-06 00:50:44 发布 · 332 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#线性回归 #最小二乘法 #机器学习算法

机器学习专栏收录该内容

22 篇文章

订阅专栏

本文通过两个实例演示了如何使用线性回归模型进行预测分析。首先介绍了如何基于无噪声的合成数据集训练线性回归模型，并评估其在训练集与测试集上的表现；随后展示了在含有噪声的真实世界糖尿病数据集上应用线性回归的过程及其性能评估。

【线性回归原理】找到当前训练数据集中y的预测值和其真实值的平方差最小的时候，所对应的w值和b值。
在这里插入图片描述

#导入数据集拆分工具
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression
X,y=make_regression(n_samples=100,n_features=2,n_informative=2,random_state=38)
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=8)
lr=LinearRegression().fit(X_train,y_train)
print('y={:2.4f}'.format(lr.coef_[0]),'x1 +','{:1.4f}'.format(lr.coef_[1]),'x2 + ','{:1.2e}'.format(lr.intercept_))
print("训练集得分：{:.2f}".format(lr.score(X_train,y_train)))
print("测试集得分：{:.2f}".format(lr.score(X_test,y_test)))

#使用含噪声的数据
from sklearn.datasets import load_diabetes#糖尿病数据集
X,y=load_diabetes().data,load_diabetes().target
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=8)
lr=LinearRegression().fit(X_train,y_train)
print("训练集得分：{:.2f}".format(lr.score(X_train,y_train)))
print("测试集得分：{:.2f}".format(lr.score(X_test,y_test)))

在这里插入图片描述