皮尔森残差_残差与标准化残差

最新推荐文章于 2024-09-03 19:40:44 发布

原创

最新推荐文章于 2024-09-03 19:40:44 发布 · 8.4k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#皮尔森残差

本文探讨了在广义线性模型（GLM）中，皮尔森残差和标准化皮尔森残差的概念。标准化过程包括残差的尺度调整和去杠杆化，目的是减轻异常值对残差的影响，使其更均匀可比。通过一个线性回归的示例，展示了异常值如何通过杠杆系数影响残差，并解释了为何需要进行这种标准化调整。同时，文章还区分了随机误差和残差的区别，强调了残差在模型诊断和重抽样中的重要性。

在GLM建模中，我们会遇到两种残差。

Pearson残差：

以及标准化Pearson残差：

其实，标准化的Pearson残差就是在Pearson残差的基础上除以sqrt(φ(1-hi)) ，这其实暗含了两个调整：

Scaling-将残差的标准差调整至1；

De-leveraging-将残差通过杠杆系数hi进行去杠杆化。

比较有趣的是第二个去杠杆化的调整，为什么要这么做呢？

为方便阐述和理解，我们回到最简单的情形-普通线性回归。先看一个简单的例子，下表中是一个模拟的数据，其中的一些要点如下：

a，b是真实的截距和斜率；

x通常在1左右变动，而观测8是一个关于x的异常值；

y=a+b*x+norm(0,1)，在直线附近加上随机扰动生成；

sigma^2=SSR/(n-p)=残差平方和/(8-2)；

H是帽子矩阵，hi是其第i个对角线元素。

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。