简单线性回归(Simple Linear Regression)

博客介绍了简单线性回归,其有一个自变量x和一个连续型因变量y,二者呈线性关系。给出假设方程y=b0+b1x,阐述算法步骤,包括求xx、yy、b1、b0等,最后展示了Python实现代码。

简单线性回归:
有且仅有一个自变量x,一个因变量y,x、y之间有线性关系,并且y是连续型变量。
假设方程为:
y=b0+b1xy=b_0+b_1xy=b0+b1x
假设有n个样本(即有n个x,n个y)
算法步骤:

  1. 求出x‾\overline{x}xx‾=1n∑i=1nxi\overline{x}=\dfrac{1}{n}\sum_{i=1}^nx_ix=n1i=1nxi
  2. 求出y‾\overline{y}yy‾=1n∑i=1nyi\overline{y}=\dfrac{1}{n}\sum_{i=1}^ny_iy=n1i=1nyi
  3. 求出b1b_1b1b1=∑i=1n(xi−x‾)(yi−y‾)∑i=1n(xi−x‾)2b_1=\dfrac{\sum_{i=1}^n(x_i-\overline{x})(y_i-\overline{y})}{\sum_{i=1}^n(x_i-\overline{x})^2}b1=i=1n(xix)2i=1n(xix)(yiy)
  4. 求出b0b_0b0b0=y‾−kx‾b_0=\overline{y}-k\overline{x}b0=ykx

代码(python)

import numpy as np
def fitSLR(x,y):
    n = len(x)
    numerator = 0
    denominator = 0
    for i in range(0,n):
        numerator +=(x[i]-np.mean(x))*(y[i]-np.mean(y))#np.mean()用于求均值
        denominator +=(x[i]-np.mean(x))**2
    b1 = numerator/float(denominator)
    b0 = np.mean(y)-b1*np.mean(x)
    return b0,b1
def predit(x,b0,b1):
    return b0+b1*x
x = [1,3,2,1,3]
y = [14,24,18,17,27]
b0,b1 = fitSLR(x, y)
x_test = 6
y_test = predit(x_test, b0, b1)
print(y_test)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值