scikit-learn中多元线性回归问题

普朗克三号粉丝

于 2021-07-30 15:18:35 发布

阅读量156

点赞数

分类专栏：机器学习文章标签：逻辑回归算法机器学习 python

本文链接：https://blog.youkuaiyun.com/weixin_45275802/article/details/119248417

版权

机器学习专栏收录该内容

35 篇文章

订阅专栏

本文介绍了如何通过Python实现线性回归模型，从加载波士顿房价数据，数据预处理，到分割训练集和测试集，模型训练，以及最终的R²分数评估。特别关注了在高维数据下线性回归的适用性和时间复杂度问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 导入数据

import numpy as np
from sklearn import datasets
boston = datasets.load_boston()

X = boston.data
y = boston.target

#去除边界值
X = X[y < 50.0]
y = y[y < 50.0]

2. 数据分割为训练集和测试集

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y,test_size = 0.2, random_state=666)

3. 使用线性回归

from sklearn.linear_model import LinearRegression

lin_reg = LinearRegression()
lin_reg.fit(X_train,y_train)
lin_reg.predict(X_test)

lin_reg.coef_ #系数
lin_reg.intercept_ # 截距

4. 算法的评测

lin_reg.score(X_test,y_test) #R Score 评测算法

补充

多元线性回归采用正规方程解，不需要进行数据归一化，但缺点是数据维度较大时，时间复杂度较高。