多层次分析与文本分析:数据处理与分类实践
1. 多层次分析中的预测质量评估
在处理嵌套数据时,没有完美的方法来衡量预测的质量。一种简单的评估方法是相关测试。由于数据集的嵌套结构,我们将为每个医院分别进行测试。以下是具体的操作步骤和代码:
correls = matrix(nrow=17,ncol=3)
colnames(correls) = c("Correlation", "p value", "r squared")
for (i in 1:17){
dat = subset(NursesMLtest, hosp == i)
correls[i,1] = cor.test(dat$predicted, dat$WorkSat)[[4]]
correls[i,2] = cor.test(dat$predicted, dat$WorkSat)[[3]]
correls[i,3] = correls[i,1]^2
}
round(correls, 3)
输出结果显示了相关性的一些变化,除了医院编号 10 外,所有的相关性在 p < 0.05 时都显著。第三列显示了预测值和观测值共享的方差部分,具体数据如下表所示:
| | Correlation | p value | r squared |
| — | — | — | — |
| [1,] | 0.488 | 0.000 | 0.238 |
| [2,] | 0.282 | 0.047 | 0.080 |
| [3,] | 0.511 | 0.000 | 0.262 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



