7-线性分类-逻辑回归-logistics regression

最新推荐文章于 2024-10-15 21:12:07 发布

原创最新推荐文章于 2024-10-15 21:12:07 发布 · 228 阅读

1 ·

CC 4.0 BY-SA版权

pytorch 专栏收录该内容

148 篇文章

订阅专栏

本文介绍了如何通过激活函数（sigmoid）将线性回归转换为线性分类，详细解释了逻辑回归中的最大后验估计(MLE)过程，展示了如何将交叉熵优化问题转化为逻辑回归的目标函数。

文章目录

1. 从线性回归到线性分类
2.最大后验估计MLE

1. 从线性回归到线性分类

我们之前用到的线性回归就是将数据 $x_i,y_i)$ 用 $W^TX$ 进行拟合，而现在的线性分类是一个{0,1}或者(0,1)分类问题，线性回归到线性分类是通过激活函数来实现数据的映射的。通过映射(激活函数)完成数据的转换 $W^TX \longmapsto\{0,1\}$
在逻辑回归(logistics regression)中常用的激活函数为：
$\sigma(z)=\frac{1}{1+e^{-z}} \tag 1$
注：激活函数有如下性质：
$_{z\rightarrow+\infty}\sigma(z)=1$
$_{z\rightarrow0}\sigma(z)=\frac{1}{2}$
$_{z\rightarrow-\infty}\sigma(z)=0$
这个激活函数叫sigmoid函数：图像如下：
在这里插入图片描述
通过激活函数(sigmoid函数)我们可以实现数据 $\mathbb{R}\longmapsto(0,1)$ ,我们将 $W^TX带入sigmoid函数可得：$
$p1=p(y=1|x)=\sigma(w^Tx)=\frac{1}{1+e^{-w^Tx}} =\psi(w,x);y=1 \tag 2$
$p2=p(y=0|x)=1-\sigma(w^Tx)=\frac{e^{-w^Tx}}{1+e^{-w^Tx}}=1-\psi(w,x) ;y=0 \tag 3$
我们可以由上式(2),(3)合并后得到如下公式：
$p(y|x)=p_1^y\cdot p_2^{1-y} \tag 4$
我们知道了p(y|x)单个的概率密度后，我们可以极大似然估计法求出对应的值：