《西瓜书》–机器学习 第一二章学习笔记(初识机器学习)
*我i什么看到微湿路面、感到春风、看到晚霞,就认为明天是好天呢?这是因为在我们的生活经验中已经遇见过很多类似的情况,这是我们基于经验做出的判断。“机器学习”-----正是一门这样的学科,它研究如何通过计算的手段,利用“经验”(计算机中通常以“数据”的形式存在)改善自身的性能。下面将介绍一些基本的概念:
-
基本术语
数据集(data set):D={x1,x2,…,xm} 表示包含m个示例的数据集。
记录:数据集中关于一个事件或对象的描述,也称“示例”(instance)或“样本”(sample)。
属性(attribute)或特征(feature):反应事件或对象在某方面的表现或性质的事项。
属性值(attribute value):属性上的取值。
属性空间(attribute space)、样本空间(sample space)或输入空间:属性涨成的空间。我们将描述事件或对象的属性分别作为不同的坐标轴,即空间中的每一个点对应一个坐标向量,因此一个示例也被称作一个“特征向量”。
学习(learning)或训练(training):从数据中学得模型(学习器(learner))的过程。训练过程中使用的数据称为“训练数据(training dat