使用R语言绘制拟合值点和实际数据点之间的线段表示残差大小
在数据分析和建模中,评估模型的好坏是非常重要的。其中之一的评估指标是残差(residual),即模型预测值与实际观测值之间的差异。为了更直观地理解残差的大小和分布情况,我们可以使用R语言绘制拟合值点和实际数据点之间的线段来表示残差的大小。
下面将介绍如何使用R语言进行绘制,并提供相应的源代码。
首先,我们需要准备一些数据来进行演示。假设我们有一组自变量x和因变量y的数据,我们使用线性回归模型进行拟合,然后绘制拟合值点和实际数据点之间的线段表示残差大小。
# 准备数据
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 6)
# 拟合线性回归模型
model <- lm(y ~ x)
# 获取拟合值和残差
fitted <- fitted(model)
residuals <- residuals(model)
# 绘制残差图
plot(x, y, ylim = range(y, fitted), pch = 16, xlab = "x", ylab = "y", main = "拟合值和实际数据点之间的残差图")
abline(model, col = "blue") # 绘制回归线
segments(x, fitted, x, y, col = "red") # 绘制拟合值点和实际数据点之间的线段
上述代码首先准备了一组自变量x和因变量y的数据。然后使用lm
函数拟合了一个线性回归模型,并分别获取了拟合值和残差。
接下来,使用