目录
1.1引言
机器学习是一种通过让计算机系统从数据中学习模式和规律,从而自动改善性能和行为的技术,适用于各种领域,包括预测、识别、决策和自动化任务。
1.2基本术语
-
机器学习:机器学习是人工智能的一个分支,致力于让计算机系统通过数据和经验自动改进。其目标是让计算机系统具备从数据中学习和提升的能力,而不需要显式地进行编程。
-
数据集:数据集是机器学习模型训练和测试的基础。它是一个由数据样本组成的集合,每个样本可以包含一个或多个特征(features)以及相应的标签(labels)。
-
特征:特征是数据集中用来描述每个样本的属性或者变量。在监督学习中,特征可以用来预测标签。
-
标签:标签是监督学习中的目标输出变量,它是我们希望模型预测或分类的结果。
-
训练:训练是指利用机器学习算法和数据集来创建模型的过程。模型通过训练数据学习特征和标签之间的关系。
-
测试:测试是评估模型预测性能的过程。