Python机器学习——监督学习

本文深入探讨了监督学习的基本概念,包括分类和回归分析。分类学习用于处理离散输出,如通过训练数据建立分类器进行预测;而回归分析则关注连续输出,旨在建立数学模型以预测特定变量。精确率和召回率是评估分类任务性能的重要指标,而回归分析则常用于理解变量间的相关性和强度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

监督学习

利用一组带有标签的数据,学习从输入到输出的映射,然后将这种映关系应用到未知数据上,达到分类或回归的目的。

  • 分类:当输出是离散时,学习任务为分类任务。
  • 回归:当输出时连续时,学习任务为回归任务。

1、分类学习

  • 输入:一组有标签的训练数据(也称观察和评估),标签表明了这些数据(观察)的所署类别。
  • 输出:分类模型根据这些训练数据,训练自己的模型参数,学习出一个适合这组数据的分类器,当有新数据(非训练数据)需要进行类别判断,就可以将这组新数据作为输入送给学好的分类器进行判断。
  • 训练集:顾名思义用来训练模型的已标注数据,用来建立模型,发现规律。
  • 测试集:也是已标注数据,通常做法时将标注隐藏,输送给训练好的模型,通过结果与真实标注进行对比,评估模型的学习能力。
  • 精确率:精确率是针对我们预测结果而言的,(以二分类为例)他表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类,另一种就是把负类预测为正类。
  • 召回率:是针对我们原来的样本而言的,它表示的是样本中正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类,另一种就是把原来的正类预测为负类。

2、回归分析

回归:统计学分析数据的方法,目的在于了解两个或多个变数间是否相关、研究其相关方向与强度,并建立数学模型以便观察特定变数来预测研究者感兴趣的变数。回归分析可以帮助人们了解在自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sygALone

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值