第一章绪论
这一章主要介绍了一些机器学习的一些基本概念,对机器学习有了更深入的了解。
数据集(data set)、示例() or 样本(sample)、属性(attribute) 属性值(attribute value)、
属性空间(attribute space) or 样本空间 or 输入空间:这三个是同一个意思,属性张成的空间。
机器学习主要分两类
有监督学习 :主要有分类 和回归两种类型
无监督学习:聚类为代表,不需要标记信息,聚类:将训练集中的数据分成若干个组,每个组称为一簇(cluster)
假设空间:可能拟合训练集的模型
版本空间:所有能够拟合训练集的模型构成的集合
泛化(generalization):训练得到的模型再新样本上面的预测能力的准确性,判断模型的好坏。
分布:假设样本服从一个D分布,然后通过足够多的样本来推测出D分布的信息,这就可以对新样本进行预测。这就很想一种经验学习,积累足够多的经验,来预测可能发生的事情。
奥卡姆剃刀(Occam‘s razor) :若有多个假设与观察一致,那就选择最简单的那个。
“没有免费的午餐定理”(NFL)&#x