逻辑回归

最新推荐文章于 2025-08-12 13:16:00 发布

原创最新推荐文章于 2025-08-12 13:16:00 发布 · 1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#逻辑回归 #Logistic Regression

机器学习专栏收录该内容

9 篇文章

订阅专栏

本文介绍了逻辑回归的概念，通过一个肿瘤恶性预测的例子，展示线性回归在分类问题上的不足，进而引入Sigmoid函数和逻辑回归模型。逻辑回归利用Sigmoid函数进行概率估计，并通过梯度下降法优化Cost Function来找到最佳决策边界。文章还讨论了多类别分类时采用的one-vs-all方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在介绍逻辑回归之前，先来看一个例子：

如下图所示，横坐标表示肿瘤大小，纵坐标表示是否为恶性，

给定8个数据，如图中×所示，求预测函数！

根据之前总结的线性回归方法，可得到下图中粉色直线，

有了 $h_{\theta }(x)$ 之后，则可确定一个阈值0.5进行预测：

如果 $h_{\theta }(x)\geq 0.5$ ,预测“y=1”

如果 $h_{\theta }(x)< 0.5$ ，预测“y=0”

也即，将Malignant=0.5的点（上图粉色线上的粗点）投影到Tumor Size轴，

投影后的点左边预测为y=0，右边预测为y=1，则能够很好地进行分类。

但是，如果数据集如下图所示呢？

这种情况下，假设线性回归预测为蓝线，那么由0.5的boundary得到的线性方程中，不能很好地进行分类。

因为不满足：

如果 $h_{\theta }(x)\geq 0.5$ ,预测“y=1”

如果 $h_{\theta }(x)< 0.5$ ，预测“y=0”

这时，我们引入Logistic Regression Model：

上图中函数 $g(z)$ 就是Sigmoid function或Logistic function，定义为 $g(z)=\frac{1}{1+e^{-z}}$

由下列公式可知，给定了数据x和参数θ，y=0和y=1的概率和为1

$P(y=0|x;\theta )+P(y=1|x;\theta )=1$

$P(y=0|x;\theta )=1-P(y=1|x;\theta )$

Decision boundary

所谓Decision Boundary就是能够将所有数据点进行很好地分类的 $h_{\theta }(x)$ 边界。

如下图所示，假设形如 $h_{\theta }(x)=g(\theta _{0}+\theta _{1}x_{1}+\theta _{2}x_{2})$ 的hypothesis参数 $\theta=[-3,1,1]^{T}$ , 则有

如果 $-3+x_{1}+x_{2}\geq 0$ ，预测y=1

如果 $-3+x_{1}+x_{2}<0$ ，预测y=0

刚好能够将图中所示数据集进行很好地分类

cost function 和梯度下降

该部分讲述如何实现简化的logistic regression系统中的梯度下降。

假设我们的数据点中y只会取0和1, 对于一个logistic regression model系统，有

那么cost function $J(\theta )$ 定义如下：

由于y只有0,1两种取值，那么 $J(\theta )$ 就可以写成

逻辑回归就是通过梯度下降方法，求出Cost function $J(\theta )$ 最小时 $\theta$ 的值，将 $\theta$ 带入 $h_{\theta }(x)$ 即得到了预测函数

在线性回归中我们已经讲了如何应用Gradient Descent, 也就是下图Repeat中的部分，将θ中所有维同时进行更新，而J(θ)的导数可以由下面的式子求得，结果如下图手写所示：

现在将其带入Repeat中：

这时我们惊奇的发现，它和线性回归中我们得到的公式是一样的~

也就是说，下图中所示，不管h(x)的表达式是线性的还是logistic regression model, 都能得到如下的参数更新过程。

以上只是考虑两类的分类，如果有很多类型，该怎么分类呢？

所谓one-vs-all method就是将二分类的方法应用到多类分类中。

比如我想分成K类，那么就将其中一类作为positive，另（k-1）合起来作为negative，这样进行K个 $h_{\theta }(x)$ 的参数优化，每次得到的一个 $h_{\theta }(x)$ 是指给定θ和x，它属于positive的类的概率。

按照上面这种方法，给定一个输入向量x，获得最大 $h_{\theta }(x)$ 的类就是x所分到的类。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。