如何评判一个好的模型?
在进行回归分析时,我们常常希望证明所使用的模型是“好的”,至少足以回答我们感兴趣的问题。下面将介绍一些评判模型好坏的方法及其局限性。
1. 模型是否拟合数据?
对于具有连续结果和一个连续协变量的回归模型,我们可以将数据与拟合的回归线一起呈现。一个好的拟合意味着观测值 $y_i$ 接近真实的期望值 $\mu(x_i) = \beta_0 + \beta_1x_i$。
我们可以通过误差项的标准差 $\sigma_e$ 来量化观测值与期望值的偏差。在回归输出中,这个标准差通常以均方根误差的形式呈现。一般来说,这个数值容易解释,因为它与结果 $Y$ 的单位相同。例如,如果 $Y$ 是收缩压测量值,当 $\sigma_e$ 的估计值为 8.3 时,说明 $Y_i$ 平均而言接近 $\mu_i$;而当估计值为 28.3 时,我们就不能说模型很好地拟合了数据。
不过,在解释误差项的标准差时,需要考虑到假设存在一组使 $\sigma_e$ 为 0 的协变量往往是不现实的。因为 $Y$ 通常还会受到一些随机测量误差的影响,这些误差无法直接由协变量解释。例如,血压测量中的误差可能是由于测量仪器的不精确或患者血压的日常变化。对于一个真正好的模型,我们希望 $\sigma_e$ 接近测量误差的标准差,但由于我们通常不知道测量误差的大小,所以很难判断误差项标准差估计值的好坏。
在逻辑模型和 Cox 模型中,没有与经典回归模型中误差项标准差相对应的参数,因此不能直接使用这种方法来评判模型,但下一节的不同视角提供了一些通用的方法。
2. 模型的预测能力如何?
误差项的标准差也可以被解释为真实模型预测能力
超级会员免费看
订阅专栏 解锁全文
1243

被折叠的 条评论
为什么被折叠?



