逻辑回归(Logistic Regression)

最新推荐文章于 2024-10-09 19:37:49 发布

原创最新推荐文章于 2024-10-09 19:37:49 发布 · 441 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

机器学习专栏收录该内容

8 篇文章

订阅专栏

逻辑回归是互联网领域应用广泛的自动分类算法，假设数据服从伯努利分布，通过极大化似然函数、运用梯度下降求解参数实现二分类。介绍了线性回归、假设函数、求解方法，如梯度下降法等，还提及L1和L2正则化，分析了其优缺点。

逻辑回归可以说是互联网领域应用最广的自动分类算法：从单机运行的垃圾邮件自动识别程序到需要成百上千台机器支撑的互联网广告投放系统，其算法主干都是LR。

一句话概括逻辑回归:

逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法，运用梯度下降来求解参数，来达到将数据二分类的目的。

线性回归

在这里插入图片描述

二分类问题

$y\in{0, 1}$
如果在线性模型上直接做分类。最直观的，可以将线性模型的输出值再套上一个函数，最简单的就是“单位阶跃函数”。

但是这个函数在x=0处不可导，所以我们找到了Logistics函数
$y=\frac{1}{1+e^{-z}}$
在这里插入图片描述

假设函数

$h_\theta(x)=g(\theta^Tx)=\frac{1}{1+e^{-\theta^Tx}}$
$ln\frac{h_\theta(x)}{1-h_\theta(x)}=\theta^Tx$
记
$P(y=1|x;\theta)=h_\theta(x) \\ P(y=0|x;\theta)=1-h_\theta(x)$
损失函数

综合起来表示概率
在这里插入图片描述

似然函数为
在这里插入图片描述

对数似然函数为
在这里插入图片描述

损失函数如下
在这里插入图片描述

求解方法：梯度下降法、牛顿法、拟牛顿法

梯度下降法

在这里插入图片描述

三种梯度下降

批量梯度下降全局最优，计算量大，训练过程慢
随机梯度下降训练速度快，局部最优
小批量梯度下降减少了参数更新的次数，可以达到更加稳定收敛结果

L1和L2正则化

过拟合：对训练数据拟合好，而在测试数据上表现差，泛化能力差。
在这里插入图片描述
正则化就是在原来的损失函数上加入一个惩罚项。

L1正则化，有助于生成一个稀疏权值矩阵，进而可以用于特征选择。
$f(\theta)=J(\theta) + \lambda||\theta||_1$

L2正则化，拟合过程中通常都倾向于让权值尽可能小，最后构造一个所有参数都比较小的模型。因为一般认为参数值小的模型比较简单，能适应不同的数据集，也在一定程度上避免了过拟合现象。
$f(\theta)=J(\theta)+\frac{\lambda} {2}||\theta||^2_2$

优点

形式简单，模型的可解释性非常好。从特征的权重可以看到不同的特征对最后结果的影响。
模型效果不错。在工程上是可以接受的（作为baseline)，如果特征工程做的好，效果不会太差。
训练速度较快。分类的时候，计算量仅仅只和特征的数目相关。

缺点

准确率并不是很高。因为形式非常的简单(非常类似线性模型)，很难去拟合数据的真实分布。
很难处理类别不平衡的问题。比如正负样本比 10000:1.我们把所有样本都预测为正也能使损失函数的值比较小。
只能处理线性可分二分类的问题。

关于逻辑回归更深入的理解，参考
逻辑回归：从入门到精通

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。