预测器的构建与应用
在数据分析和预测领域,预测器的构建是一项关键任务。它能够帮助我们根据已知的协变量信息,对未知的结果进行预测。下面将详细介绍不同类型结果的预测器构建方法、相关的精度评估以及如何使用 Stata 软件来实现这些预测。
1. 从风险评分到预测器
在很多情况下,仅仅知道一个主体的风险评分是不够的,我们更希望得到一个具体的预测值。例如,预测新生儿出生后第 2 天的胆红素水平,我们不仅关心预期值,还希望知道实际可能观察到的值,并且有一个区间来描述胆红素水平的可能范围。
预测通常是针对原始样本之外的新主体进行的。我们用 $X_1^ , X_2^ , \cdots, X_p^ $ 表示新主体的协变量值,用 $Y^ $ 表示未知的结果。预测器是新主体协变量值 $X_1^ , X_2^ , \cdots, X_p^ $ 和在原始样本中估计的回归参数 $\hat{\beta}_0, \hat{\beta}_1, \cdots, \hat{\beta}_p$ 的函数,其输出值在 $Y$ 的尺度上,可表示为 $\hat{Y}(\hat{\beta}_0, \hat{\beta}_1, \cdots, \hat{\beta}_p, X_1^ , X_2^ , \cdots, X_p^ )$,为了简便,后续用 $\hat{Y}$ 表示。
2. 连续结果的预测与预测区间
2.1 预测器的选择
对于连续结果,通常直接使用风险评分作为预测器,即:
$\hat{Y} = \hat{\eta}(X_1^
超级会员免费看
订阅专栏 解锁全文
28万+

被折叠的 条评论
为什么被折叠?



