线性回归与高级回归模型实践:线性回归解决统计估计问题

使用线性回归解决统计估计问题

学习目标

本课程采用线性回归建模,计算回归系数的统计属性(包括标准误差、t 统计量和 p 值),总体回归的 F 统计量及其推断,以及 ( R^2 ) 和调整 ( R^2 )。此外,绘制残差图、标准化残差的直方图以及 Q-Q 图,以检验线性、同方差性和正态性假设。

相关知识点

  • 线性回归解决统计估计问题

学习内容

1. 线性回归解决统计估计问题

1.1 读取数据集
wget https://model-community-picture.obs.cn-north-4.myhuaweicloud.com/ascend-zone/notebook_datasets/a24fc362da0311ef813cfa163edcddae/slump_test.data
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("slump_test.data",sep=',')
df.drop('No',axis=1,inplace=True)
df.head()
df.shape
1.2 自定义线性回归模型训练

要将 Pandas DataFrame 数据适配到模型中,需要以列表形式指定预测特征列名,并以字符串形式指定目标变量列名。

%pip install mlr
from mlr.MLR import MyLinearRegression as mlr
m = mlr()
predictors = list(df.columns[:7])
print(predictors)
1.3 打印指标

输出模型参数:系数及截距项

m.coef_
m.intercept_
# 输出模型评估指标:
print ("R-squared: ",m.r_squared())
print ("Adjusted R-squared: ",m.adj_r_squared())
print("MSE: ",m.mse())
# 获取所有模型评估指标:
m.print_metrics()
1.4 计算 R2R^2R2并调整R2R^2R2

从其定义来看,( R^2 ) 是一个基本的量度,它反映了模型对数据的解释程度。它是通过计算误差平方和(SSR)与总平方和(SST)的比值来确定的。

现在,

SST=SSR+SSE SST = SSR + SSE SST=SSR+SSE

因此,

R2=SSRSST=1−

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值