一、SVM定义
支持向量机(Support Vector Machine,SVM):
\qquad 进行二分类问题的学习,设计最优的一个超平面,将两个不同的样本分离开来,这个超平面我们就称它为支持向量机
\qquad 得到最优超平面的学习策略,使间隔(margin)最大化,
二、线性问题
讨论在二维空间的线性可分
如下图所示:
(1)上图中,我们找到具有最大的间隔,当需要测试新的数据时,分类的结果会有更高的可信度。
(2)由图中可知,上下的边界会经过一些样本数据点,这些数据点的位置,决定了间隔的大小,称这些样本数据点为支持向量(Support vector),中间的超平面就称为支持向量机
三、非线性问题
1.问题描述
上面的测试用例是在二维空间内线性可分的,然而在现实任务中,训练集样本也并不是都能够存在一个能正确划分两类样本的超平面。例如下图:
\qquad 针对上述问题,我们可以将二维数据利用某种方法映射到三维空间中,这样就可以找到一个超平面将其两类样本分隔开。
\qquad 将数据映射到高维,为了找到合适的超平面,这个特征空间的维度可能很高,甚至无穷维,这个给求取超平面带来了一定的难度,为解决这个问题,核函数横空出世,它避免了求解高维甚至无穷维特征空间中的内积。
2.常用的核函数:
线性核
多项式核
高斯核(又称为RBF核)
拉普拉斯核
Sigmoid核
四、软间隔
1.定义
\qquad 在上面二、三讨论的问题,一直假设的是训练样本在样本空间或特征空间中是线性可分的,即存在一个超平面能将不同类的样本完全划分开。