统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法,称其为统计学习方法的三要素,简称为模型、策略和算法。
实现统计学习方法的步骤如下:
(1)得到一个有限的训练数据集合;
(2)得到包含所有可能的模型的假设空间,即学习模型的集合;
(3)确定模型选择的准则,即学习的策略;
(4)实现求解最优模型的算法,即学习的算法;
(5)通过学习方法选择最优模型;
(6)利用学习的最优模型最新数据进行预测或者分析
人们根据输入变量X和输出变量Y不同的类型,对预测任务给予不同的名称:输入变量与输出变量均为连续变量的预测问题称为回归问题;输出变量为有限个离散变量的预测问题称为分类问题;输入问题与输出问题均为变量序列的预测问题称为标注问题。