一、基础概念
线性回归研究的是一个目标变量和一个自变量之间的回归问题,但有时候在很多实际问题中,影响目标变量的自变量往往不止一个,而是多个,比如绵羊的产毛量这一变量同时受到绵羊体重、胸围、体长等多个变量的影响,因此需要设计一个目标变量与多个自变量间的回归分析,即多元回归分析。由于线性回归并不适用于所有的数据,我们需要建立曲线来适应我们的数据,现实世界中的曲线关系很多都是增加多项式实现的,比如一个二次函数模型:

再或者一个三次函数模型:

这两个模型我们绘制的图形如下所示:

二、Excel多元线性回归
数据分析
- 在Excel打开house_prices.csv文件,在数据选项中打开数据分析,选择其中的回归。
- 在选择其中的area,bathroom,bedroom作为x,可以得出三相数据和price是正相关。而黄线部分得出了对房价的预测。

三、机器学习库Sklearn库多元线性回归
导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets
from sklearn.linear_model import LinearRegression
from mpl_toolkits.mplot3d import Axes3D # 不要去掉这个import
from sklearn.metrics import mean_squared_error, r2_score
plt.rcParams['font.sans-serif'

本文介绍了多元线性回归的基础概念,并通过Excel进行数据分析展示目标变量与多个自变量之间的关系。接着利用Python的Sklearn库实现多元线性回归建模,通过模型优化提高预测精度。总结了多元线性回归在实践中的应用。
最低0.47元/天 解锁文章
5234

被折叠的 条评论
为什么被折叠?



