李宏毅深度学习笔记（六）逻辑回归

最新推荐文章于 2023-05-13 21:27:35 发布

原创最新推荐文章于 2023-05-13 21:27:35 发布 · 318 阅读

1 ·

CC 4.0 BY-SA版权

李宏毅深度学习专栏收录该内容

14 篇文章

订阅专栏

本文深入探讨了逻辑回归模型的数学基础，包括如何通过sigmoid函数将线性模型转换为概率预测，以及如何使用最大似然估计和交叉熵损失函数来优化模型参数。同时，文章对比了逻辑回归与线性回归在不同损失函数下的表现差异。

设置函数

我们可以找到一个函数 $P_{w,b}(C_1|x)$ ，如果 $P_{w,b}(C_1|x)\ge0.5$ 则输出 $C_1$ ，否则输出 $C_2$ 。
逻辑回归的模型如下：
$P_{w,b}(C_1|x)=\sigma(z)$

$z=wx+b=\sum_{i=1}^nw_ix_i+b$

$\sigma(z)=\frac{1}{1+exp(-z)}$
在这里插入图片描述
所以我们设置函数为：

判断函数的好坏

假设我们有下面的一组数据：
在这里插入图片描述
我们假定数据是依据函数 $f_{w,b}(x)=P_{w,b}(C_1|x)$ 生成的，那么接下来我们就要求取参数 $w$ 和 $b$ 了。
我们定义：

最有可能让训练集呈现上面的样子的是使 $L (w, b)$ 最大的 $w^*$ 和 $b^*$ ，即：

为了简化计算，我们对上式进行一下转换：
在这里插入图片描述
这时候原本的乘法就变成了加法：

又（这里用到了交叉熵.），我们定义 $- l n L (w, b)$ 为交叉熵损失函数

找一个最好的函数

交叉熵损失函数对 $w_i$ 求偏导（这里用到了求导的链式法则）
在这里插入图片描述
进行化简得：

逻辑回归和线性回归的对比

在这里插入图片描述

为什么逻辑回归不用平方损失函数

如果我们在逻辑回归中用了平方损失函数的话：
在这里插入图片描述
我们可以看到，如果目标值 $\hat y^n=1$ ，当 $f_{w,b}(x^n)=1$ 时，偏导数为0，也就是说因为我们计算出来的值跟目标值是一样的所以不需要更新，这是正确的。但当 $f_{w,b}(x^n)=0$ 的时候，平方损失函数的偏导数为0，也就是说不需要更新，但事实上我们的计算值离实际值很远。
同样的情况会出现在 $\hat y^n=0$ 中。
在这里插入图片描述