数据分析中的模型选择与逻辑回归应用
1. 模型选择
在数据分析中,我们经常需要选择合适的模型来拟合数据。通过以下代码可以计算不同模型的拟合优度:
dev.explained = function(fit) {
round(1 - with(summary(fit), deviance/null.deviance),
3)
}
dev.explained(wong.glm.norm)
dev.explained(wong.glm.pois1)
dev.explained(wong.glm.qpois1)
dev.explained(wong.glm.nb)
运行上述代码后,得到的结果如下:
| 模型 | 拟合优度 |
| — | — |
| wong.glm.norm | 0.949 |
| wong.glm.pois1 | 0.888 |
| wong.glm.qpois1 | 0.888 |
| wong.glm.nb | 0.939 |
从这些结果来看,对数响应的线性模型和负二项式模型是比较值得考虑的。由于负二项式模型能够明确地对计数数据进行建模,因此它可能是更优的选择。
2. 逻辑回归基础
逻辑回归,也称为二项广义线性模型(GLM),在技术上应称为伯努利 GLM,因为它对伯努利随机变量的均值进行建模。伯努利分布用于模拟只有两种可能结果的数据,即成功或失败,这样的随机实验通常被称为伯努利试验。伯努利分布的均值等于成功的概率 $p$。
数据分析中的模型选择与逻辑回归应用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



