逻辑回归（logistic regression）

最新推荐文章于 2024-01-08 13:29:21 发布

原创

最新推荐文章于 2024-01-08 13:29:21 发布 · 1.3k 阅读

1 ·

CC 4.0 BY-SA版权

逻辑回归是一种判别分析方法，用于分类任务。它基于线性边界假设，通过最大后验概率确定类别。在K类问题中，只需K-1组系数即可构建分类边界，避免了大量计算。在二分类问题中，逻辑回归使用一个线性多项式决定决策边界。通过简化、计算和迭代求解，最终实现模型收敛。正则化如L2正则化的逻辑回归能进一步提高模型的泛化能力。

一、数学上的逻辑回归

前面提到，逻辑回归是判别分析方法来分类的，即通过给定的数据x, 来直接得到其后验概率。且它得到的是线性分类边界。

回顾在贝叶斯准则中，利用0-1损失进行分类时，我们做法是以最大的后验概率的类 k，来作为依据。

${\hat G}(x) =\mathop {\arg \max }\limits_kPr(G = k|X=x)$

从而第k 类和第 l 类的分类边界通过使其概率相等来决定：即样本 x 在第k 类和第l 类有相等的后验概率。

$Pr(G = k|X=x) = Pr(G = l|X=x)$

如果我们我们对两个概率进行相除，并且取 log 的话，这样得到一个比率，在上述情况有

$log \frac{Pr(G = k|X=x)} {Pr(G = l|X=x)} = 0$

如果我们想要强制得到一个线性分类边界，我们可以假设这个函数可以线性表示，即

$log \frac{Pr(G = k|X=x)} {Pr(G = l|X=x)} = a_0^{(k,l)} + \sum \limits_{j=1}^p{a_j^{(k,l)}} x_j$

逻辑回归就是在这样一个假设的的基础上得到的。其中对不同的两类类，有不同的系数上标（k,l）, 其系数也不同。

这样看着很容易理解，那肯定也会有这样的疑问，那岂不是每两类就要找一个 $a_0^{(k,l)}$ ，那计算量岂不是很大！

然而在逻辑回归中，我们并不用每两类都要找一组系数，对于 K 类，我们只需要进行 K-1 对配对，找K-1 组系数就可以了。

假设开始

现在我们有 K 类，我们让第K 类（可以是任何一个类）作为一个基类，这样对于剩余的 K-1 类，得到 K-1 组系数情况：

$\begin{align*} log \frac{Pr(G = 1|X=x)} {Pr(G = K|X=x)}& = \beta_{10} + \beta_1^T x\\ log \frac{Pr(G = 2|X=x)} {Pr(G = K|X=x)}& = \beta_{20} + \beta_2^T x\\ & \vdots \\ log \frac{Pr(G = K-1|X=x)} {Pr(G = K|X=x)}& = \beta_{(K-1)0} + \beta_{K-1}^T x \end{align*}$