线性回归
回归是在建模过程中用于分析变量之间的关系、以及变量是如何影响结果的一种技术。线性回归是指全部由线性变量组成的回归模型
线性回归的几个特点:
1. 建模速度快,不需要很复杂的计算,在数据量大的情况下依然运行速度很快。
2. 可以根据系数给出每个变量的理解和解释
3. 对异常值很敏感
#生成数据
import numpy as np
#生成随机数
# np.random.seed(1234)
x = np.random.rand(5000,12)
w=np.random.randint(1,100,size=(12,))
print('真实的参数值',w)
noise=np.random.randint(1,3,size=(5000,))
#构建映射关系,模拟真实的数据待预测值
y = x.dot(w)+noise # 矩阵相乘 x.dot(y) 等价于 np.dot(x,y)
print(y.shape)
import numpy as np
from sklearn.linear_model import LinearRegression
# 调用模型
lr = LinearRegression(fit_intercept=True)
# 训练模型
lr.fit(x,y)
print("估计的参数值为:%s" %(lr.coef_))
# 计算R平方
pr