回归标准差和残差平方和的关系_R相关与回归学习笔记(十一)——模型的检验...

本文介绍了在R语言中回归分析的相关概念,包括复相关系数平方(R方)、残差平方和及其与回归拟合质量的关系。强调了R方和调整R方在评估模型拟合优度时的作用,并提到了过度拟合的问题。同时,解释了残差标准误差作为模型随机误差标准差估计量的重要性。通过具体的体重与身高、年龄的模型实例,展示了相关数值的计算与理解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本笔记中原始数据及代码均来源于李东风先生的R语言教程,在此对李东风先生的无私分享表示感谢。

复相关系数平方

将总平方和分解为:

67bff503190406a9a3a3cca400591e25.png

其中 - 总平方和

42c83967faa47c5b5262a63a1ad621c2.png

- 回归平方和

3ff61691dbfd4ea3d3e41b5fc8a4ec05.png

是能够用回归系数和自变量的变量解释的因变量变化。 - 残差平方和

be65ddd85ef0f626de55d106270c380e.png

是回归模型不能解释的因变量变化。 回归平方和越大,残差平方和越小,回归拟合越好。 定义复相关系数平方(判定系数)

c6153f89d2b20b3c73afd252996d961b.png

则0≤R方≤1。 R方越大,说明数据中的自变量拟合因变量值拟合越好。 但是,“拟合好”不是唯一标准。 仅考虑拟合好, 可能产生很复杂的仅对建模用数据有效但是对其它数据无效的模型, 这称为“过度拟合”。 定义调整的(修正的)复相关系数平方:

348746153f1f0a9a8b9f0534f6672600.png

克服了R方的部分缺点。 在体重与身高、年龄的模型结果中,R方=0.7729,R*方=0.7445

残差标准误差

模型中ε的方差σ方的估计为σe^方,

dbed032e042c0e62ebc5c8f62c5744dd.png

σ^是随机误差的标准差σ的估计量, 称为“残差标准误差”(Residual standard error)。 这是残差ei=yi-yi^的标准差的一个较粗略的近似估计。 在体重与身高、年龄的模型结果中,σ^=11.51 。

往期回顾

R相关与回归学习笔记(一)——相关分析

R相关与回归学习笔记(二)——相关与因果、相关系数大小、相关系数的检验

R相关与回归学习笔记(三)——相关阵、一元回归分析

R相关与回归学习笔记(五)——回归有效性

R相关与回归学习笔记(六)——R程序

R相关与回归学习笔记(七)——回归诊断(一)

R相关与回归学习笔记(七)——回归诊断(二)

R相关与回归学习笔记(八)——回归诊断(三)

R相关与回归学习笔记(九)——预测区间、控制、多元线性回归模型

R相关与回归学习笔记(十)——参数估计、R的多元回归程序(一)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值