使用线性回归解决统计估计问题
学习目标
本课程采用线性回归建模,计算回归系数的统计属性(包括标准误差、t 统计量和 p 值),总体回归的 F 统计量及其推断,以及 ( R^2 ) 和调整 ( R^2 )。此外,绘制残差图、标准化残差的直方图以及 Q-Q 图,以检验线性、同方差性和正态性假设。
相关知识点
- 线性回归解决统计估计问题
学习内容
1. 线性回归解决统计估计问题
1.1 读取数据集
wget https://model-community-picture.obs.cn-north-4.myhuaweicloud.com/ascend-zone/notebook_datasets/a24fc362da0311ef813cfa163edcddae/slump_test.data
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("slump_test.data",sep=',')
df.drop('No',axis=1,inplace=True)
df.head()
df.shape
1.2 自定义线性回归模型训练
要将 Pandas DataFrame 数据适配到模型中,需要以列表形式指定预测特征列名,并以字符串形式指定目标变量列名。
%pip install mlr
from mlr.MLR import MyLinearRegression as mlr
m = mlr()
predictors = list(df.columns[:7])
print(predictors)
1.3 打印指标
输出模型参数:系数及截距项
m.coef_
m.intercept_
# 输出模型评估指标:
print ("R-squared: ",m.r_squared())
print ("Adjusted R-squared: ",m.adj_r_squared())
print("MSE: ",m.mse())
# 获取所有模型评估指标:
m.print_metrics()
1.4 计算 R2R^2R2并调整R2R^2R2
从其定义来看,( R^2 ) 是一个基本的量度,它反映了模型对数据的解释程度。它是通过计算误差平方和(SSR)与总平方和(SST)的比值来确定的。
现在,
SST=SSR+SSE SST = SSR + SSE SST=SSR+SSE
因此,
R2=SSRSST=1−

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



