logistic 回归模型(分类器)

最新推荐文章于 2025-02-18 20:08:45 发布

Cookiedemo

最新推荐文章于 2025-02-18 20:08:45 发布

阅读量1.6k

点赞数

分类专栏：机器学习文章标签： logistic回归机器学习

本文链接：https://blog.youkuaiyun.com/oPiHai/article/details/84350355

版权

本文介绍了Logistic回归模型作为分类器的工作原理，包括Sigmoid函数的应用、非线性决策边界以及如何找到合适的参数。通过梯度下降算法求解最小化成本函数，并讨论了在实际数据中可能遇到的问题及解决策略。最后提到了代码实现中的一些关键点和注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.logistic Regression Model

我们希望
$0\leq h_\theta(x)$
$h_\theta(x)=g(\theta^Tx)$
这里 $g (x)$ 是一个sigmod函数, $g(z) = 1/(1+e^{-z})$ ,(或者称之为logistic函数)，将假设公式代入sigmod函数得：
$h_\theta(x) = \frac{1}{1+e^{-\theta^Tx}}$
在这里插入图片描述

Logistic 回归模型本质是做一个分类器（虽然算法中有回归），用于两分类问题（即输出只有两类），接下来我们需要按照数据分布来确定边界（边界即区分两种数据的曲线），在二维坐标轴中。
如下图2所示，我们要区分图中的圆圈和XX明显需要一个线性决策边界，即一条直线能够将图中的数据分隔在曲线两侧。因此这里我们的分类假设函数即为： $h_\theta(x) = g(\theta_0+\theta_1x_1+\theta_2x_2)$ 。这里 $\theta_0+\theta_1x_1+\theta_2x_2$ 的取值实际上是在实数集上，但是通过sigmoid函数我们就可以将所有的可能的取值集合映射到 $[0, 1]$ 的区间上去。最终分类结果取决于 $h_\theta(x)$ 的值

$P(y=1|x;\theta)=h_\theta(x)\\ P(y=0|x;\theta)=1-h_\theta(x)$

在这里插入图片描述
图2. 线性决策边界

但是实际数据分布情况一般都不是线性可分的（即用一条直线就能够区分两种数据），因此我们需要尝试不同的假设函数来找到不同的决策边界，如图3所示；这里我们使用的假设函数就不是线性函数了，而是圆形函数 $h_\theta(x)=g(\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_1^2+\theta_4x_2^2)$