逻辑回归:原理、应用与实战
1. 逻辑回归模型的定义
在许多实际问题中,我们关注的结果变量往往是连续变量,但也经常会遇到二元变量 $Y$ 的情况。这时,逻辑回归模型就派上用场了。在逻辑回归模型里,我们将 $Y$ 取值为 1 的概率建模为协变量 $X_1,X_2, …, X_p$ 的函数。用 $\pi(x_1,x_2, …, x_p)$ 表示在给定协变量值 $x_1,x_2, …, x_p$ 时,观察到 $Y = 1$ 的条件概率。
我们可能首先会考虑这样一个模型:$\pi(x_1,x_2, …, x_p) = \beta_0 +\beta_1x_1 +\beta_2x_2 + … +\beta_px_p$。然而,这个模型存在一个问题,等式左边的量是一个介于 0 到 1 之间的数,而右边可以取 $-\infty$ 到 $\infty$ 之间的任意值。为了解决这个问题,我们对等式左边进行变换,最常用的是 logit 变换,使用 logit 函数:$logit p = log\frac{p}{1 - p}$,这样就得到了逻辑回归模型:$logit \pi(x_1,x_2, …, x_p) = \beta_0 +\beta_1x_1 +\beta_2x_2 + … +\beta_px_p$。
逻辑回归模型中回归参数的解释与经典回归模型类似,但它描述的是在 logit 尺度上观察到 $Y = 1$ 的概率变化。如果比较除了协变量 $x_j$ 有 $\Delta$ 的差异外,其他协变量值相同的两个对象,那么在 logit 尺度上观察到 $Y = 1$ 的条件概率相差 $\Delta\times\beta_j$。
2. 用逻辑回归分析剂量反应实验
在
超级会员免费看
订阅专栏 解锁全文
1082

被折叠的 条评论
为什么被折叠?



