机器学习算法（二）逻辑斯蒂回归

最新推荐文章于 2024-03-21 11:58:35 发布

谦芊珺

最新推荐文章于 2024-03-21 11:58:35 发布

阅读量609

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习算法文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Yolanda71/article/details/76039086

机器学习同时被 2 个专栏收录

9 篇文章

订阅专栏

9 篇文章

订阅专栏

本文介绍了逻辑斯蒂回归的基本原理及应用，详细解释了sigmoid函数的作用，并通过对比线性回归阐述了逻辑斯蒂回归作为分类算法的特点。文章还探讨了最大似然估计法及其在求解参数中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上文中说过，逻辑斯蒂回归虽然称为回归，但它实际上是一种分类算法。认识逻辑斯蒂回归，首先需要知道sigmoid函数。下面公式1即为sigmoid函数

g (x) = 1 1 + e - x

$g\left( x\right) =\dfrac {1}{1+e^{-x}}$ 它的函数图像如图所示。
这里写图片描述

这里写图片描述

1、算法介绍

和上文中的回归算法一样，我们有m条数据，每条数据有n个特征和1个标签。不同的是，上文的标签是一个连续型变量，本文中的标签是一个离散型变量，且它只有两个值，[0,1]。
在线性回归中，有 $\widehat{y}=\theta ^{T}x$ ，而在逻辑斯蒂回归中，其结果就是在线性回归外面套上sigmoid函数，即

y ˆ = 1 1 + e - θ T x

$\widehat {y}=\dfrac {1}{1+e^{-\theta ^{T}x}}$ 因此，

yˆ $\widehat {y}$ 是一个连续变量，其取值范围为(0,1)。

对于 $y$ 和 $\widehat {y}$ ,我们希望，当 $\widehat {y}$ 接近1时， $y$ 也大概率为1；当 $\widehat {y}$ 接近0时， $y$ 也大概率为0。因此可以做出如下假设。

p (y = 1 | x, θ) = y ˆ

$p(y=1| x,\theta )=\widehat {y}$

p (y = 0 | x, θ) = 1 - y ˆ

$p(y=0| x,\theta )=1-\widehat {y}$
以上两式可以统一为

P (y | x, θ) = y ˆ y (1 - y ˆ) 1 - y

$P\left( y| x,\theta \right) =\widehat {y}^{y}\left( 1-\widehat {y}\right) ^{1-y}$ 同理，由于x和y均已知，它是一个关于

θ $\theta$ 的函数。
据此可求出其最大似然函数：

L (θ) = \prod i = 1 m y ˆ y (1 - y ˆ) 1 - y

$L\left( \theta \right) =\prod ^{m}_{i=1}\widehat {y}^{y}\left( 1-\widehat {y}\right) ^{1-y}$ ，

i $i$ 为第

i $i$ 个样本。
同理，可求其对数似然函数为

l(θ) $l\left( \theta \right)$ ，并对每个

θ $\theta$ 求偏导。求导结果为：

\partial l ( θ ) \partial θ j = \sum i = 1 m (y i - y ˆ i) x i j

$\dfrac {\partial l\left( \theta \right) }{\partial \theta_{ j}}=\sum ^{m}_{i=1}\left( y^{i}-\widehat {y}^{i}\right) x^{i}_{j}$

对其进行梯度上升学习，有

θ j = θ j + α (y - y ˆ) x j

$\theta _{j}=\theta _{j}+\alpha \left( y-\widehat {y}\right) x_{j}$

逻辑斯蒂回归的目标函数被习惯性的认为成对数似然函数的相反数，即

l o s s = - l (θ)

$loss=-l\left( \theta \right)$

前文中，我们认为y的取值为0，1。若认为y的取值为+1和-1，则可推导出一个较为优美的损失函数如下。

l o s s = \sum i = 1 m [ln (1 + e - y i y ˆ i)]

$loss=\sum ^{m}_{i=1}\left[ \ln \left( 1+e^{-y_{i}\widehat {y}_{i}}\right) \right]$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。