线性回归与广义线性模型
1 线性回归基础
线性回归是一种广泛使用的统计方法,用于建立因变量(目标变量)与一个或多个自变量(预测变量)之间的线性关系。在R语言中,线性回归可以通过 lm()
函数实现。这一部分将详细介绍线性回归的基本原理、模型拟合、诊断和解释。
1.1 线性回归模型
线性回归模型的基本形式为:
[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + … + \beta_p X_p + \epsilon ]
其中,(Y)是因变量,(X_1, X_2, …, X_p)是自变量,(\beta_0, \beta_1, …, \beta_p)是回归系数,(\epsilon)是误差项。误差项假定服从均值为0、方差为(\sigma^2)的正态分布。
1.2 模型拟合
使用 lm()
函数可以拟合线性回归模型。下面是一个简单的例子,展示如何使用 lm()
函数拟合线性回归模型:
# 加载内置数据集mtcars
data(mtcars)
# 拟合线性回归模型
model <- lm(mpg ~ wt + hp, data = mtcars)
# 查看模型摘要
summary(model)
1.3 模型诊断
模型诊断是评估模型拟合质量的重要步骤。常用的诊断方法包括残差分析、QQ图、杠杆值和影响度量等。以下是几种常用的诊断方法: