1. 导入数据
import numpy as np
from sklearn import datasets
boston = datasets.load_boston()
X = boston.data
y = boston.target
#去除边界值
X = X[y < 50.0]
y = y[y < 50.0]
2. 数据分割为 训练集 和 测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size = 0.2, random_state=666)
3. 使用线性回归
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X_train,y_train)
lin_reg.predict(X_test)
lin_reg.coef_ #系数
lin_reg.intercept_ # 截距
4. 算法的评测
lin_reg.score(X_test,y_test) #R Score 评测算法
补充
多元线性回归采用正规方程解,不需要进行数据归一化,但缺点是数据维度较大时,时间复杂度较高。