1、特点
统计学习以数据为研究对象(数据驱动),以方法为中心,目的是为了对数据进行预测与分析。
2、方法
统计学习包括监督学习,非监督学习,半监督学习,强化学习。(以监督学习为主进行介绍)
统计学习的方法包括模型的假设空间、模型选择的准则以及模型学习的方法。
统计学习方法三要素:模型,策略,算法
统计学习方法步骤:
- 得到一个有限训练数据集
- 确定包含所有可能的模型假设空间,即学习模型的集合
- 确定模型选择的准则,即学习的策略
- 实现求解最优模型的算法,即学习的方法
- 通过学习方法选择最优模型
- 利用学习的最优模型对新数据进行预测与分析
监督学习
其任务是学习一个模型,使模型能够对于任意给定的输入,对其对用的输出做出一个好的预测(此处的输入输出为系统的输入输出,与学习的输入输出不同)
统计学习三要素
方法=模型+策略+算法
统计学习首要考虑的问题是学习什么样的模型,接着考虑按照什么样的准则学习或选择最优的模型。
策略:用经验风险估计期望风险。经验风险是模型关于训练样本集的平均损失,期望风险是模型关于联合分布的期望损失。但是经验风险估计期望风险往往不理想,要对经验风险进行矫正,这关系到监督学习的两个基本策略:经验风险最小化和结构风险最小化。