逻辑回归原理和实践探究

最新推荐文章于 2025-11-24 15:52:28 发布

原创最新推荐文章于 2025-11-24 15:52:28 发布 · 191 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #数据挖掘

机器学习专栏收录该内容

3 篇文章

订阅专栏

本文探讨逻辑回归作为二分类问题的解决方案，解释如何通过sigmoid函数将线性回归转换为分类任务。从线性回归方程出发，结合sigmoid函数的特性，推导逻辑回归的数学原理，并介绍其在实际应用中的表达形式和似然函数。同时，文章还展示了如何利用对数似然函数进行梯度下降求解。

逻辑回归原理和实践

逻辑回归解决的问题并不是回归问题，而是经典的二分类问题。其实分类和回归的本质并没有实质性的区别，原理是只要将回归任务用sigmoid函数将连续的值映射到0-1之间，然后添加一个阈值，就可以达到分类的任务。
在上一篇线性回归的博客中我们重点分析了其中的数学原理和理论实践，感兴趣的小伙伴可以参考一下，接下来我们在上一篇的基础上来探讨逻辑回归的相关数学原理和实际应用。
线性回归方程：
$y = W X + b$
sigmoid函数：
$σ(z)=11+exp(−z)\sigma(z)=\frac{1}{1+exp(-z)}$
函数图像如下：
在这里插入图片描述
我们将线性回归的方程代入到sigmoid函数：
$σ(y)=11+exp(−y)\sigma(y)=\frac{1}{1+exp(-y)}$
$σ(WX+b)=11+exp(−(WX+b))\sigma(WX+b)=\frac{1}{1+exp(-(WX+b))}$
同样我们写成矩阵相乘的格式：
$σ(WTX)=11+exp(−WTX)\sigma(W^TX)=\frac{1}{1+exp(-W^TX)}$
假设成二分类任务：
$P(y=1∣X;W)=σ(WTX)=hW(X)P(y=1|X;W)=\sigma(W^TX)=h_W(X)$
$P(y=0∣X;W)=1−σ(WTX)=1−hW(X)P(y=0|X;W)=1-\sigma(W^TX)=1-h_W(X)$
上述表达式是为了使正样本与负样本的概率和为1.
整合得：
$P(y|X;W)=h_W(X)^y(1-h_W(X))^{1-y}$
引入似然函数：
$L(w)=∏i=0np(yi∣xi;w)=∏i=1nhW(xi)y(1−hW(xi))1−yL(w)=\prod_{i=0}^np(y_i|x_i;w)=\prod_{i=1}^nh_W(x_i)^y(1-h_W(x_i))^{1-y}$
对数似然：
$l(w)=logL(w)=∑i=1n(yiloghW(xi)+(1−yi)log(1−hW(xi)))l(w)=logL(w)=\sum_{i=1}^n(y_ilogh_W(x_i)+(1-y_i)log(1-h_W(x_i)))$
在原始的公式中加入 $- 1 / n$ 变成求解梯度下降的问题，推导过程如下：
在这里插入图片描述
其中 $j$ 表示第 $j$ 个特征的权重.