间隔与支持向量
给定训练样本集,
,这里一定记住只有两类:-1和+1,并非0/1类。分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。
以上是以二维平面为例,可以看到有很多个超平面将两类数据分开,那我们应该去找哪一个呢??? 直观的看,找最中间的划分超平面,其受数据扰动比如异常数据的“容忍性”最强,泛化能力最大。知道找哪一个,那应该如何找到?
给定训练样本集,
,这里一定记住只有两类:-1和+1,并非0/1类。分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。
以上是以二维平面为例,可以看到有很多个超平面将两类数据分开,那我们应该去找哪一个呢??? 直观的看,找最中间的划分超平面,其受数据扰动比如异常数据的“容忍性”最强,泛化能力最大。知道找哪一个,那应该如何找到?