计数和比例数据建模实战
在数据分析中,对计数和比例数据进行建模是一项重要任务。本文将深入探讨如何运用不同的模型对这类数据进行分析,包括泊松模型、负二项式广义线性模型(GLM)等,并通过实际案例展示它们的应用。
1. 模型拟合评估
在评估模型拟合效果时,我们通常会用到残差偏差(Residual deviance)。可以通过特定命令使残差偏差显示在输出结果底部,也能使用 deviance 函数获取。我们将残差偏差与自由度等于残差偏差自由度(ν)的卡方分布的95%临界点进行比较。若残差偏差小于该临界点,在某些条件下,泊松模型可被认为是合适的。
例如,第一个模型的残差偏差为29230,自由度为49。而自由度为49的卡方分布的95%临界值是66.34,显然该模型拟合效果很差。我们还可以用 1 - Pr(X² < Dres) (其中X²是自由度为ν的卡方随机变量,Dres是残差偏差)来衡量模型拟合度,类似于R²。若只有偏差分析表且不方便使用R,一个快速的直观检查方法是,残差偏差应接近残差自由度。有学者建议残差偏差不超过自由度的两倍,这是因为自由度大于2的卡方随机变量的均值为ν,方差为2ν,且当ν > 8时,ν + 2√(2ν)(2个标准差区间的上限)小于2ν。
| 模型情况 | 残差偏差 | 自由度 | 95%临界值 | 拟合评价 |
|---|---|---|---|---|
| 第一个模型 |
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



