支持向量机的一个重要特征:当训练完成后,大部分样本都不需要保留,最终模型只与支持向量有关。
对于非线性问题,需要采用非线性变换,将非线性问题变换成线性问题。
可以将训练样本从原始空间映射到一个更高维的空间,使得样本在这个空间中线性可分。如果原始空间维数是有限的,即属性是有限的,那么一定存在一个高维特征空间使样本线性可分。
在线性不可分的情况下,支持向量机首先在低维空间中完成计算,然后通过核函数将输入空间映射到高维特征空间,最终在高维特征空间中构造出最优分类超平面,从而把平面上本身不好分的非线性数据分开。
核函数和映射没有关系。核函数是计算高维空间中的内积的一种简便的方法。
Xi 和Xj在特征空间的内积等于它们在原始样本空间中通过函数K(·,·)计算的结果。