- 机器学习:让一个模型能够通过数据调优自己,后续的数据可以通过模型获得更贴近真实的结论
- 数据集:也叫样本,可以简单理解为一个个对象构建成的集合
- 训练样本:构建的数据集中的一部分被拿来训练模型的子集
- 标记:数据集中的对象可以被打上一个标签,比如你三天下了十笔订单,可以叫做高活用户
- 标记空间:将对象中的数据和对象的标记组合,然后重新形成的集合就叫标记空间
- 学习任务类别:分类(好瓜,坏瓜);回归(好瓜0.95,好瓜0.37);聚类(训练集中的对象根据自己的数据判断内在规律,打上标记)
- 正类:分类任务中只涉及两个类别,我们需要判断出来的类别就是正类
- 反类:分类任务中只涉及两个类别,我们不需要判断出来的类别就是反类
- 测试样本:构建的数据集中一部分被用来测试模型的数据构成的集合就叫测试样本,一般测试样本是训练样本在全部数据集中的补集
- 假设空间:对象可以整合的特征可能出现的集合
- 版本空间:假设空间中和训练集一致的多个假设形成的子集
- 机械学习:死记硬背式学习
- 类比学习:从观察和发现中学习
- 归纳学习:
机器学习的初学术语掌握
最新推荐文章于 2024-07-11 14:38:37 发布