残差与杠杆关系的可视化(使用R语言)
在统计建模和回归分析中,残差与杠杆是两个重要的概念。残差表示实际观测值与回归模型预测值之间的差异,而杠杆则衡量了每个观测值对回归模型的拟合结果的影响程度。通过可视化残差与杠杆关系图,我们可以更好地理解数据点对回归模型的影响,并识别出可能的异常值或离群点。
下面是使用R语言进行残差与杠杆关系图可视化的示例代码:
# 导入所需的包
library(ggplot2)
library(dplyr)
library(broom)
# 生成一个示例数据集
set.seed(123)
x <- rnorm(100)
y <- 2 * x + rnorm(100)
data <- data.frame(x, y)
# 拟合线性回归模型
model <- lm(y ~ x, data = data)
# 提取残差和杠杆值
residuals <- augment(model) %>% pull(.resid)
leverage <- augment(model) %>% pull(.hat)
# 绘制残差与杠杆关系图
ggplot(data, aes(x = leverage, y = residuals)) +
geom_point() +
geom_smooth(method = "loess", se = FALSE, color = "red") +
xlim(0, max(leverage)) +
ylim(min(residuals), max(residuals)) +
labs(x = "杠杆值", y = "残差") +
ggtitle("