机器学习全套教程(十七)-- 分类算法-逻辑回归与二分类

本文深入探讨了逻辑回归的应用场景、原理,包括sigmoid激活函数、损失函数和优化方法。通过实例介绍了如何使用sklearn进行逻辑回归,并讨论了在癌症分类预测中的应用。同时,文章阐述了精确率、召回率、F1-score等分类评估方法,以及ROC曲线和AUC指标在样本不均衡情况下的评估作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分类算法-逻辑回归与二分类

学习目标

  • 目标
    • 说明逻辑回归的损失函数
    • 说明逻辑回归的优化方法
    • 说明sigmoid函数
    • 知道逻辑回归的应用场景
    • 知道精确率、召回率指标的区别
    • 知道F1-score指标说明召回率的实际意义
    • 说明如何解决样本不均衡情况下的评估
    • 了解ROC曲线的意义说明AUC指标大小
    • 应用classification_report实现精确率、召回率计算
    • 应用roc_auc_score实现指标计算
  • 应用
    • 癌症患者预测

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。

1、逻辑回归的应用场景

  • 广告点击率
  • 是否为垃圾邮件
  • 是否患病
  • 金融诈骗
  • 虚假账号

看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器

2、 逻辑回归的原理

2.1 输入

逻辑回归输入

逻辑回归的输入就是一个线性回归的结果。

2.2 激活函数

  • sigmoid函数

sigmoid公式

  • 分析
    • 回归的结果输入到sigmoid函数当中
    • 输出结果:[0, 1]区间中的一个概率值,默认为0.5为阈值

逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别,并且这个类别默认标记为1(正例),另外的一个类别会标记为0(反例)。(方便损失计算)

输出结果解释(重要):假设有两个类别A,B,并且假设我们的概率值为属于A(1)这个类别的概率值。现在有一个样本的输入到逻辑回归输出结果0.6,那么这个概率值超过0.5,意味着我们训练或者预测的结果就是A(1)类别。那么反之,如果得出结果为0.3那么,训练或者预测结果就为B(0)类别。

所以接下来我们回忆之前的线性回归预测结果我们用均方误差衡量,那如果对于逻辑回归,我们预测的结果不对该怎么去衡量这个损失呢?我们来看这样一张图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值