R语言计算回归模型中每个样本的DFFITS度量:预测在排除单个观测点后的变化
回归模型是统计学中常用的建模方法,用于分析自变量与因变量之间的关系。在回归分析中,我们通常希望了解每个样本对于模型的拟合程度以及其对预测结果的影响。DFFITS度量是一种用于评估在排除单个观测点后,回归模型所做的预测发生的变化程度的方法。
DFFITS度量可以帮助我们判断在删除某个观测点后,模型的预测结果是否发生了显著的变化。它通过计算排除观测点后,预测值的差异与标准误差的比值来度量。如果DFFITS值大于某个阈值(通常是2√((k+1)/n)),则可以认为该观测点对于模型的预测结果具有显著影响。
下面我们将使用R语言来计算回归模型中每个样本的DFFITS度量。
首先,我们需要准备一些数据来构建回归模型。这里我们使用mtcars数据集作为示例数据。
# 导入数据集
data(mtcars)
# 构建回归模型
model <- lm(mpg ~ ., data = mtcars)
现在我们已经建立了回归模型,接下来我们将计算每个样本的DFFITS值。
# 计算预测值
predictions <- predict(model)
# 计算标准化残差
standardized_residuals <- rstandard(model)
# 计算杠杆值