深入浅出:逻辑回归全解析
1. 逻辑回归的引入与背景
在预测未来结果时,若结果是连续变量,可使用回归分析。但当结果为分类变量时,线性回归就不再适用,这时逻辑回归便派上用场。例如,预测一个人未来的职业是消防员、医生还是摇滚明星,这就是一个分类结果的预测问题。
逻辑回归本质上是多元回归的扩展,其结果变量为分类变量,预测变量可以是连续或分类变量。在最简单的形式中,它能根据某些信息预测一个人可能属于的两个类别。比如,通过测量一个人的懒惰程度、固执程度、酒精摄入量和打嗝次数,来预测其性别。
逻辑回归在医学研究中具有重要的应用价值。例如,它可以用于生成模型,预测肿瘤是恶性还是良性。通过分析患者数据库,确定影响肿瘤恶性程度的变量,再将新患者的相关变量值代入逻辑回归模型,就可以估计肿瘤恶性的概率。如果概率较低,医生可能会决定不进行昂贵且痛苦的手术。
当预测的分类结果只有两个时,称为二元逻辑回归;当预测的分类结果超过两个时,则使用多项(或多分类)逻辑回归。
2. 逻辑回归的原理
2.1 与线性回归的对比
为了便于理解逻辑回归的原理,我们先回顾一下线性回归。在简单线性回归中,结果变量 (Y) 由直线方程预测:
[Y_i = b_0 + b_1X_{1i} + \varepsilon]
其中,(b_0) 是 (Y) 截距,(b_1) 是直线的斜率,(X_1) 是预测变量的值,(\varepsilon) 是残差项。通过最小二乘法,可以估计方程中的未知参数,使得因变量的观测值和预测值之间的平方距离最小。
在多元回归中,有多个预测变量,每个预测变量都有自己的系数。(Y) 由每个预测
超级会员免费看
订阅专栏 解锁全文
955

被折叠的 条评论
为什么被折叠?



