机器学习总结之----2.逻辑回归

最新推荐文章于 2021-11-08 17:07:17 发布

原创最新推荐文章于 2021-11-08 17:07:17 发布 · 411 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#逻辑回归 #笔记 #西瓜书 #机器学习

机器学习专栏收录该内容

7 篇文章

订阅专栏

本文深入探讨逻辑回归的概念，从线性回归引入sigmod函数，形成概率预测模型，详细讲解了逻辑回归的代价函数、极大似然估计及梯度下降法求解参数的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

什么是逻辑回归
逻辑回归的代价函数
极大似然估计
利用梯度下降法求参数

我也只是在学习的过程中，相当于自己理解推导一遍做个笔记，参考了别人很多东西，文末有相关链接。

什么是逻辑回归

逻辑回归也叫做对数几率回归，但它却用来做二分类。
线性回归产生的预测值为 $\theta^{T}x$ ，线性回归通常用来做回归。但是可以在线性回归基础上，加上性质像阶跃函数但光滑可导的sigmod函数，然后算出一个概率 $\widehat{p}$ 来。如果 $\widehat{p}$ 大于0.5，可以将它判定为一类（比如正例1），小于等于0.5判定为另一类（比如负例0）。

其中，sigmod函数（简写为 $\sigma$ ）为：
$\sigma(z)=\frac{1}{1+e^{-z}}$

sigmod

逻辑回归，在我看来就是线进行线性回归，再在它的基础上加上sigmod函数，得到一个概率值，进而判断该样本属于哪一类。计算公式如下：
$\widehat{p} = \sigma(z) = \sigma(\theta^{T}\cdot x) = h_{\theta}(x)$
其中， $\theta$ 是权重，也是我们待求参数。
根据概率值 $\widehat{p}$ 对样本进行分类：
$\widehat{y} =\left\{\begin{matrix} 0 & \widehat{p}<0.5,\\ 1 & \widehat{p}\geq 0.5 \end{matrix}\right.$

逻辑回归的代价函数

为了使正样本得到高的概率值 $\widehat{p}$ （接近1好），负样本得到低的概率值 $\widehat{p}$ （接近0好），从而找出权重参数 $\theta$ 。设计单个样本的损失函数如下：
$c(\theta) =\left\{\begin{matrix} -log(\widehat{p}) & y=1,\\ -log(1 - \widehat{p}) & y=0 \end{matrix}\right.$
对于整个数据集m个样本的损失函数如下：
$J(\theta) = -\frac{1}{m} \sum_{i=1}^{m} [ y^{(i)} log(p^{(i)}) + (1-y^{(i)}) log(1-p^{(i)})]$
虽然没有bishijie封闭解，但因为 $J(\theta)$ 是凸函数，可以用梯度下降法求解。

极大似然估计

由以上公式，可知任何一个样本都有：
$\left\{\begin{matrix} P(y=1|x;\theta) = h_{\theta}(x)\\ P(y=0|x;\theta) = 1 - h_{\theta}(x) \end{matrix}\right.$

整合一下：
$P(y|x;\theta) = h_{\theta}(x) ^{y} (1 - h_{\theta}(x)) ^{1-y}$

那么，对于所有m个样本发生的概率是：
$L(\theta) = \prod_{i=1}^{m} P(y^{(i)}|x^{(i)};\theta) = \prod_{i=1}^{m} h_{\theta}(x^{(i)}) ^{y^{(i)}} (1 - h_{\theta}(x^{(i)})) ^{1-y^{(i)}}$