皮尔森残差_残差与标准化残差

本文探讨了在广义线性模型(GLM)中,皮尔森残差和标准化皮尔森残差的概念。标准化过程包括残差的尺度调整和去杠杆化,目的是减轻异常值对残差的影响,使其更均匀可比。通过一个线性回归的示例,展示了异常值如何通过杠杆系数影响残差,并解释了为何需要进行这种标准化调整。同时,文章还区分了随机误差和残差的区别,强调了残差在模型诊断和重抽样中的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在GLM建模中,我们会遇到两种残差。

Pearson残差:

a4c26d1e5885305701be709a3d33442f.png

以及标准化Pearson残差:

a4c26d1e5885305701be709a3d33442f.png

其实,标准化的Pearson残差就是在Pearson残差的基础上除以sqrt(φ(1-hi)) ,这其实暗含了两个调整:

Scaling-将残差的标准差调整至1;

De-leveraging-将残差通过杠杆系数hi进行去杠杆化。

比较有趣的是第二个去杠杆化的调整,为什么要这么做呢?

为方便阐述和理解,我们回到最简单的情形-普通线性回归。先看一个简单的例子,下表中是一个模拟的数据,其中的一些要点如下:

a,b是真实的截距和斜率;

x通常在1左右变动,而观测8是一个关于x的异常值;

y=a+b*x+norm(0,1),在直线附近加上随机扰动生成;

sigma^2=SSR/(n-p)=残差平方和/(8-2);

H是帽子矩阵,hi是其第i个对角线元素。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值