数据分析 NO.23 多元线性回归

本文深入探讨了多元线性回归的原理与应用,强调了修正多元判定系数的重要性,并阐述了如何利用T检验和F检验来评估模型的有效性。此外,还讲解了分类自变量在模型中的处理方式。

1,多元线性回归
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
多元线性回归,对拟合优度进行判定,用的都是修正多远判定系数。

在这里插入图片描述
多元回归模型,T检验和F检验要一起用起来,先F再T

F是检验总体的,T检验是对每一个系数做一个显著性检验

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

分类自变量:
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
有几个值,就定几个义值-1的数量

在这里插入图片描述

对空气质量数据进行多元线性回归分析的步骤如下: 1. 读取数据 首先,使用pandas库中的`read_csv()`函数或其他适合的函数读取空气质量数据,将其转换为DataFrame对象。例如: ```python import pandas as pd # 读取数据 data = pd.read_csv('air_quality_data.csv') ``` 2. 数据预处理 在进行多元线性回归分析前,需要对数据进行预处理,包括数据清洗、数据标准化等。 - 数据清洗:对数据中的缺失值、异常值进行处理,保证数据的准确性和完整性。 ```python # 去除空值 data = data.dropna() ``` - 数据标准化:将数据按照一定的比例缩放,使得数据具有可比性。 ```python from sklearn.preprocessing import StandardScaler # 标准化数据 scaler = StandardScaler() data[['PM2.5', 'PM10', 'SO2', 'NO2', 'CO', 'O3']] = \ scaler.fit_transform(data[['PM2.5', 'PM10', 'SO2', 'NO2', 'CO', 'O3']]) ``` 3. 多元线性回归模型的建立 使用Scikit-learn库中的`LinearRegression()`函数建立多元线性回归模型。 ```python from sklearn.linear_model import LinearRegression # 建立多元线性回归模型 X = data[['PM2.5', 'PM10', 'SO2', 'NO2', 'CO', 'O3']] Y = data['AQI'] model = LinearRegression() model.fit(X, Y) ``` 4. 模型评估 使用模型对数据进行拟合后,需要对模型进行评估,以评估模型的拟合效果。 - 可以使用Scikit-learn库中的`score()`函数计算模型的拟合度(R^2)。 ```python r_sq = model.score(X, Y) print('R^2:', r_sq) ``` - 可以使用Scikit-learn库中的`mean_squared_error()`函数计算均方误差(MSE)。 ```python from sklearn.metrics import mean_squared_error y_pred = model.predict(X) mse = mean_squared_error(Y, y_pred) print('MSE:', mse) ``` 5. 模型应用 使用已建立的多元线性回归模型对新数据进行预测。 ```python new_data = [[35, 70, 13, 30, 0.5, 50]] predicted_aqi = model.predict(new_data) print('Predicted AQI:', predicted_aqi) ``` 以上就是对空气质量数据进行多元线性回归分析的基本步骤。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值