西瓜书学习笔记——第一章:绪论

本文是《机器学习》(西瓜书)的学习笔记,详细介绍了机器学习的基本术语,包括数据集、属性、假设空间和泛化能力等。通过探讨归纳偏好和“聪明”算法与“笨拙”算法的关系,强调了归纳偏好的重要性及其在选择模型中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.1 引言

  • 机器学习的定义(由[Mitchell,1997]提出):假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。

1.2 基本术语

  • 数据集( D D D):记录的集合
  • 示例(instance):数据集D中的每一条记录
  • 属性(attribute),特征(feature):反映事件或对象在某一方面的表现或性质的事项(西瓜的色泽,大小)
  • 属性空间,样本空间,输入空间:属性张成的空间(对于某个示例,将它的属性各自作为坐标轴,则形成了属性空间。不同示例由于自身的不同属性值,对应着不同的点,因此我们把一个示例也称为“特征向量”)
  • 训练:从数据中学得模型的过程
  • 假设(hypothesis):即学得模型(我们意图用学得模型逼近关于数据的某种潜在的规律,故学得模型也称为假设)
  • 标记(label):关于示例的结果信息(如:好瓜)
  • 样例(example):拥有了标记信息的示例
  • 识别学习任务的类型:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值