计数和比例数据建模及实验设计
1. 逻辑回归中的响应完全分离示例
在VH - CDT数据集中,响应变量“alc”相对于“age”和“vhcdt1”的绘图显示,这两个变量单独使用时都能较好地分离数据,当两者结合时,只有两个案例被错误分类。图6.14中的线是通过“肉眼”不科学地拟合的,使用支持向量机(SVM)分类器可能会找到更好的线。当尝试用这两个变量拟合逻辑回归模型时,会收到警告信息,因为“vhcdt1”和“age”的线性组合几乎完美地分离了响应变量。
2. 教程
- 肝脏数据操作
- 加载肝脏数据:
data(liver.df)
names(liver.df)
2. 拟合逻辑回归(二项式广义线性模型),以“emh”为响应变量,“sids”为解释变量:
liver.fit = glm(emh ~ sids, data = liver.df, family = binomial)
3. 通过偏差分析表的卡方检验来测试“sids”变量的显著性:
anova(liver.fit, test = "Chisq")
4. 检查模型摘要表:
<