监督学习——基本概念
今天第一次用Markdown写文档,好兴奋~
整理一下统计学习的基本概念,顺便练习一下输入公式~
1. 概述
监督学习是区别于非监督学习、半监督学习和强化学习的概念。[1]中有一个对监督学习的任务描述:
从给定的训练数据集合出发,假设要学习的模型属于某个函数的集合(即假设空间,hypothesis space),应用某个评价准则选择最优的模型。
2. 空间
由于监督学习有标签,输入变量X和输出变量
输入由特征表示,所有的特征向量构成一个特征空间。特征空间的每一维对应一个特征。
假设空间为由输入空间到输出空间映射的集合。监督学习的模型可以为概率模型或非概率模型,假设空间可以是由参数向量决定的函数族:
3. 策略
策略就是按照什么样的准则学习或选择最优模型。这里定义损失函数和风险函数。损失函数L(Y,f(X))评价一次预测的好坏,例如0-1损失函数,平方损失函数,对数似然损失函数等。风险函数就是期望损失,评价平均意义下模型的好坏:
4. 模型评估
给定损失函数以后,可以用模型的训练误差和测试误差评估学习方法。训练误差是指模型关于训练数据集的平均损失。测试误差是指模型关于测试数据集的平均损失。
如果样本数据充足,选择模型的方法就是随机将数据集分为三部分:训练集,验证集(validation set)和测试集。训练集用来训练模型,验证集用来选择模型,测试集用于最终对学习方法的评估。
如果样本不充足,可以采用交叉验证的方法(cross validation),即把数据分成若干单元,将切分后的单元组成训练集和测试集,反复进行训练、测试和模型选择。
学习方法的泛化能力(generalization ability)是指该方法学习到的模型对未知数据的预测能力。实际应用中采用最多的是通过测试误差评价泛化能力,或者用模型的期望风险作为泛化误差。
评价分类器的方法可以用分类准确率,即正确分类的样本数与总样本数之比。对于二分类问题,常用的指标为精确率(precision)和召回率(recall)。定义正类和负类后,可能出现以下几种情况:TP——将正类预测为正类数;FN——将正类预测为负类数;FP——将负类预测为正类数;TN——将负类预测为负类数。精确率定义为:
5. 生成模型和判别模型
生成方法是由数据学习联合概率分布P(X,Y),然后求出条件概率分布作为预测的模型:
判别方法由数据直接学习决策函数或者条件概率分布。判别方法关心的是对给定的输入X应该预测什么样的输出
参考资料
[1] 李航《统计学习方法》