初识线性回归

本文介绍了使用Excel进行线性回归分析,然后通过jupyter编程使用最小二乘法重新进行分析,并借助sklearn库进行对比。随着数据量增加,编程方法的优势明显,能快速调整并获取线性回归方程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

excel数据分析

 jupyter编程用最小二乘法重做线性分析 

借助skleran重做分析过程 

 

总结


excel数据分析

首先选取20组数据,回归方程式和相关系数R2如下图:

接下来选取200组数据进行分析,数据如下:

 

然后选取与2000组数据,结果如下:

 

 jupyter编程用最小二乘法重做线性分析 

import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
points = np.genfromtxt("D:/wh.csv",delimiter=",")
#将wh.csv文件中的数据赋值给points
#将points中的数据分别赋给x,y,求回归方程y=ax+b
x=points[0:20,1];
y=points[0:20,0];
#根据自己需要使用数据的个数更改[]中的值
pccs = np.corrcoef(x, y)
c,d=pccs
e,f=c
x_mean = np.mean(x)
y_mean = np.mean(y)
xsize = x.size
zi = (x * y).sum() - xsize * x_mean *y_mean
mu = (x ** 2).sum() - xsize * x_mean ** 2
a = zi / mu
b = y_mean - a * x_mean
a = np.around(a,decimals=2)
b = np.around(b,decimals=2)
print(f'回归线方程:y = {a}x + {b}')
print(f'相关系数为{f}')
#使用第三方库skleran画出拟合曲线
y1 = a*x + b
plt.scatter(x,y)
plt.plot(x,y1,c='r')

取20组数据的代码和结果如下:

200组:

 

2000组:

 

借助skleran重做分析过程 

from sklearn import linear_model        #表示,可以调用sklearn中的linear_model模块进行线性回归。
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
data = np.loadtxt(open("D:wh.csv","rb"),delimiter=",",skiprows=0)
data1=data[0:20]#根据所取数据更改值
x=[example[1] for example in data1]
y=[example[0] for example in data1]
pccs = np.corrcoef(x, y)
c,d=pccs
e,f=c
X = np.asarray(x).reshape(-1, 1)
Y = np.asarray(y).reshape(-1, 1)
model = linear_model.LinearRegression()
model.fit(X,Y)
b=model.intercept_[0] #截距
a=model.coef_[0]#线性模型的系数
a1=a[0]
print(f'回归线方程:y = {a1}x + {b}')
print(f'相关系数为{f}')
y1 = a1*X + b
plt.scatter(X,Y)
plt.plot(x,y1,c='r')

20组:

200组:

 

2000组:

 

 

总结

三种求线性回归方程的方法求出的值基本一致,但利用编程计算时,当数据的个数改变时,只需要改变代码中某个值就能快速得出线性回归方程,这比仅使用Excel更快速方便,特别是调用第三方库时,更加方便。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值