15、广义线性模型入门:应对计数数据的挑战

广义线性模型入门:应对计数数据的挑战

1. 泊松GLM不适用计数数据的情况

在处理计数数据时,泊松广义线性模型(Poisson GLM)通常是一个不错的选择。但在实际应用中,它并非总是表现良好。接下来,我们将探讨泊松GLM可能遇到的问题以及相应的解决方法。

2. 过度离散(Overdispersion)

过度离散指的是数据中的额外变异。在泊松分布中,方差应等于均值,但在实际数据中,由于各种因素,这个假设往往不成立。

2.1 过度离散的原因
  • 未测量因素 :在生物学等领域,我们很难测量所有影响变量的因素。例如,在研究个体、种群特征时,总会有一些重要方面无法测量,这些未测量因素会导致数据产生额外变异。
  • 数据非独立性 :数据中的某些元素(如个体、种群等)之间可能存在相似性,而非相互独立。比如昆虫实验中,同一窝的昆虫由于共享基因和饲养环境,彼此更为相似。
2.2 过度离散的影响

如果忽略过度离散,会导致p值出现偏差,产生过多的假阳性结果,即我们可能会认为发现了实际上并不存在的效应。

2.3 检测过度离散

我们可以通过计算“离散指数”来检测过度离散。以Soay绵羊的泊松回归为例:

summary(soay.glm)
## 
## Call:
## glm(formula = fitness ~ body.size, family = poisson(link =
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值