机器学习的基本概念
基本术语
- 特征:反映事件或者对象在某方面的表现或者特征的事项。也称属性
- 属性值:在某个属性上的取值
- 属性空间:属性张成的空间,称为属性空间,样本空间或者输入空间。
- 特征向量:空间中每个点,对应的一个坐标向量
- 维数:每一个示例的属性的个数
- 学习:根据数据学习到模型的过程,也称为训练
- 训练数据:训练过程中使用的数据
- 训练样本:训练数据中每个样本称为一个训练样本
- 训练集:所有训练样本的集合称为训练集
- 假设:学习数据中某种潜在的规律。
- 真实:数据中潜在规律本身,称为真实。学习过程就是假设逼近真实的过程
- 样例,示例,标记:(xi,yi),表示第i个样例,yi是属于示例xi的标记,Y是所有标记的集合,称为标记空间或输入空间
- 分类:预测的结果是离散值