逻辑回归

最新推荐文章于 2025-06-05 15:23:24 发布

luv_dusk

最新推荐文章于 2025-06-05 15:23:24 发布

阅读量329

点赞数 1

文章标签：逻辑回归

本文链接：https://blog.youkuaiyun.com/weixin_43269174/article/details/92660085

版权

算法同时被 2 个专栏收录

25 篇文章

订阅专栏

机器学习

7 篇文章

订阅专栏

概念

E.n. Logistic Regression，经典的机器学习分类算法之一，与线性回归同属于广义线性模型 (generalized linear model)。逻辑回归的作用域在于整个实数集。经由参数 $W$ 和 $b$ (统称为 $\theta$ ) 线性变换后得出的实数，由特定函数投射到 $[0, 1]$ 的值域范围内：
$z_i=f(X_i;\theta)=f(W^TX_i+b)$

二分类

在二分类中， $f$ 即为 Sigmoid 函数，求出的 $z$ 可以理解为样本属于正案例的概率， $(1 - z)$ 即为样本属于负案例的概率，这里我们将判断分类的阈值设为 $0.5$ ，
$z_i=\frac{1}{1+e^{-(W^TX_i+b)}}$

$\hat{y_i}=\begin{cases}0,& z_i<0.5\\1, & z_i\ge0.5 \end{cases}$

我们希望最大化全部样本预测正确的综合概率，似然函数
$l(X;\theta)=\prod_{X_i\in X} z_i^{y_i}(1-z_i)^{1-y_i}$

使用极大似然法求解最优参数 $\theta^*$ ，
$\theta^* =\arg\max_\theta l(X;\theta)=\arg\min_\theta-\log l(X;\theta)$

由此，最大化似然函数的问题转变为最小化损失函数
$L(X;\theta)=-\sum_i\big(y_i\log z_i +(1-y_i)\log (1-z_i)\big)$

这也就是我们常见的交叉熵损失函数。经过简化，损失函数成为
$L(X;\theta)=-\sum_i\big(y_iz_i+\log (1+e^{z_i})\big)$

若样本标签从当前的 ${0,1\}$ 改为 ${-1,1\}$ ，则重写后的上述公式为
$L(X;\theta)=-\sum_i\log\big(1+e^{-z_iy_i}\big)$

也就是我们熟悉的 Logistic Loss。模型训练过程中，使用梯度下降法或牛顿法逐步拟合参数。

Algorithm LogisticRegression( $D$ , $\eta$ ):
Input: Sample data $D=\{(X_i,y_i)\}$ , learning rate $\eta$ .
Output: Prediction result $\hat{y}$ .
initialize $W$ and $b$ ;
while not converged do
$z\leftarrow \sigma(W^TX+b)$
$L\leftarrow -y\log z-(1-y)\log(1-z)$
$W\leftarrow W-\eta\cdot \frac{\partial L}{\partial W}$
$b\leftarrow b-\eta\cdot \frac{\partial L}{\partial b}$
return $\mathbb{I}\big(\sigma(W^TX+b)\ge0.5\big)$

多分类

多分类的思路与二分类不大，针对每一种分类单独训练一套参数，标签为 “属于该分类” 和 “不属于该分类”。各个分类下的模型最后求出来的 $z$ 值通过 Softmax 函数归一化处理后的值即为分属于该分类的概率。
$softmax(z_k)=\frac{e^{z_k}}{\sum_{k=1}^Ke^{z_k}}$