大数据案例分析学习笔记1.3(分类及其性能度量)

本文深入探讨了分类问题作为有监督学习的核心,介绍了两类与多类分类的解决策略,包括一对其余方法,并详细讨论了分类性能度量指标,如准确率、精确率、召回率、F值及ROC曲线。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分类问题

  • 分类问题是有监督学习的一个核心问题,当输出变量取有限个离散值时,预测问题别成为分类问题
  • 分类的机器学习的两大阶段(1)从训练数据中学习得到一个分类决策函数或分类模型,称为分类器(classifier);(2)利用学习得到的分类器对新的输入样本进行类别预测
  • 两类分类问题与多类分类问题。多类分类问题也可以转化为两类分类问题解决,如采用一对其余的方法,将其中一个类标记为正类。然后将剩余的其他类都标记为负类,假设共有n类,需要构建n个分类问题。

分类性能度量——准确率

在这里插入图片描述

分类性能度量——精确率和召回率

在这里插入图片描述

分类性能度量——P-R曲线

在这里插入图片描述

分类性能度量——F值

在这里插入图片描述

分类性能度量——ROC

在这里插入图片描述
在这里插入图片描述

分类性能可视化

在这里插入图片描述

分类报告

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值