[机器学习]线性回归模型

本文介绍了线性回归的基本概念,包括函数表达式、多元和一元回归,以及平方误差成本函数和梯度下降算法的应用。通过实验使用generated_data.csv数据,构建了线性回归模型并预测x=3.5时的y值,结果显示模型表现良好,MSE接近0,R2接近1。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

线性回归

线性回归:根据数据,确定两种或两种以上变量间相互依赖的定量关系

函数表达式:
y=f(x1,x2...xn) y = f(x_1,x_2...x_n) y=f(x1,x2...xn)
​ 回归根据变量数分为一元回归[y=f(x)y=f(x)y=f(x)]和多元回归[y=f(x1,x2...xn)y = f(x_1,x_2...x_n)y=f(x1,x2...xn)],根据函数关系分为线性回归[y=ax+by=ax+by=ax+b]与非线性回归[y=ax2+bx+cy=ax^2+bx+cy=ax2+bx+c]

平方误差成本函数

minimize(J)minimize(J)minimize(J)
J=12m∑i=1m(yi‘−yi)2=12m∑i=1m(axi+b−yi)2=g(a,b) J=\frac{1}{2m} \sum_{i=1}^{m}(y^{`}_i-y_i)^2=\frac{1}{2m} \sum_{i=1}^{m}(ax_i+b-y_i)^2=g(a,b) J=2m1i=1m(yiyi)2=2m1i=1m(axi+byi)2=g(a,b)

梯度下降算法

J=f(p)J=f(p)J=f(p)
p=p−α∂∂pif(pi) p = p - \alpha \frac{\partial}{\partial p_i}f(p_i) p=pαpif(pi)

​ 寻找极小值的一种方法。通过向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索,直到在极小点收敛。

实验:

基于generated_data.csv数据,建立线性回归模型,预测x=3.5对应的y值,评估模型表现

#load the data
import pandas as pd
data = pd.read_csv('D:\workspace\data\ML\generated_data.csv')

data.head()
print(type(data), data.shape)

x = data.loc[:,'x']
y = data.loc[:,'y']
print(x,y)

#visualize the data 
from matplotlib import pyplot as plt
plt.figure(figsize=(5,5))
plt.scatter(x,y)
plt.show()

# set up a linear regression model
from sklearn.linear_model import LinearRegression
lr_model = LinearRegression()

import numpy as np
x = np.array(x)
x = x.reshape(-1,1)
y = np.array(y)
y = y.reshape(-1,1)

lr_model.fit(x,y)

y_predict = lr_model.predict(x)
print(y_predict)

print(y)

y_predict_single = lr_model.predict([[3.5]])

print(y_predict_single)

# a/b print
a = lr_model.coef_
b = lr_model.intercept_
print(a,b)

from sklearn.metrics import mean_squared_error, r2_score
MSE = mean_squared_error(y, y_predict)
R2 = r2_score(y, y_predict)
print(MSE, R2)

plt.figure()
plt.plot(y,y_predict)
plt.show()

运行结果:

在这里插入图片描述

其中MSE为 3.1554436208840474e−313.1554436208840474e^{-31}3.1554436208840474e31,R2为1.0

实验结论:在这个实验中,我们建立了一个单因子线性回归模型,得到x=3.5对应的y值为12,其均方误差(MSE)非常接近于零,而确定系数(R^2)接近于1。这表明我们的模型可以非常好地拟合数据,预测能力非常强。

附:generated_data,csv数据
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值