『第一章 诸论』
『1.1 引言』
学习算法:机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。
学习算法的作用:
1.基于提供的经验数据产生模型;
2.面对新情况时,模型可提供相应的判断。
模型:泛指从数据中学得的结果。
『1.2 基本术语』
数据集:记录的集合
示例/样本/特征向量:每条记录或空间中的每个点
属性/特征:反映事件或对象在某方面的表现或性质的事项
属性值:属性上的取值
属性空间/样本空间/输入空间:属性张成的空间
维数:示例的属性描述个数
学习/训练:从数据中学的模型的过程
训练数据:训练过程中使用的数据
训练样本:训练过程中使用数据的每个样本
训练集:训练样本组成的集合
假设:学得模型对应了关于数据的某种潜在数据
真实/真相:这种潜在规律本身
学习器:学习算法在给定数据和参数空间上的实例化
标记:关于示例结果的信息
样例:拥有了标记信息的示例
标记空间/输出空间:所有标记的集