(202101180017 阿布都许库尔·买买提)
1. 数据:在机器学习中,数据是最基本的单元,它可以是数字、文字、图像等,是机器学习模型进行学习和预测的原料。
2. 数据集:数据集是数据的集合,它由多个数据点组成,每个数据点可以是一个样本,包含了多个属性。
3. 训练集:训练集是数据集的一个子集,用于训练机器学习模型。模型通过分析训练集中的数据,学习如何进行预测或分类。
4. 测试集:测试集也是数据集的一个子集,用于评估训练好的模型的性能。模型在测试集上的表现能够反映出其泛化能力,即对未知数据的处理能力。
5. 样本/示例:样本或示例通常指的是数据集中的单个数据点,它可能是一个特征向量,也可能是一个标记过的数据点。
6. 属性:属性是描述样本的特征或特性,例如在识别手写数字的任务中,每个像素点的灰度值可以是一个属性。
7. 属性集:属性集是指一个样本所有属性的集合,它定义了样本的特征空间。
8. 属性空间:属性空间是由所有属性集构成的向量空间,每个样本在这个空间中都可以表示为一个点。
9. 特征向量:特征向量是样本在属性空间中的表示,通常是一个多维数组,其中的每个元素对应一个属性的值。