机器学习的初学术语掌握

本文介绍了机器学习的基础术语,包括数据集、训练样本、标记、标记空间和学习任务类别等。探讨了分类、回归和聚类任务,以及正类、反类、测试样本和假设空间的概念。还讲解了过拟合、欠拟合以及评估学习器泛化误差的留出法、交叉验证法和自助法。最后,讨论了性能度量如错误率、精度、查准率、查全率和分类结果混淆矩阵。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 机器学习:让一个模型能够通过数据调优自己,后续的数据可以通过模型获得更贴近真实的结论
  • 数据集:也叫样本,可以简单理解为一个个对象构建成的集合
  • 训练样本:构建的数据集中的一部分被拿来训练模型的子集
  • 标记:数据集中的对象可以被打上一个标签,比如你三天下了十笔订单,可以叫做高活用户
  • 标记空间:将对象中的数据和对象的标记组合,然后重新形成的集合就叫标记空间
  • 学习任务类别:分类(好瓜,坏瓜);回归(好瓜0.95,好瓜0.37);聚类(训练集中的对象根据自己的数据判断内在规律,打上标记)
  • 正类:分类任务中只涉及两个类别,我们需要判断出来的类别就是正类
  • 反类:分类任务中只涉及两个类别,我们不需要判断出来的类别就是反类
  • 测试样本:构建的数据集中一部分被用来测试模型的数据构成的集合就叫测试样本,一般测试样本是训练样本在全部数据集中的补集
  • 假设空间:对象可以整合的特征可能出现的集合
  • 版本空间:假设空间中和训练集一致的多个假设形成的子集
  • 机械学习:死记硬背式学习
  • 类比学习:从观察和发现中学习
  • 归纳学习:
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

卑微-程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值