课程概要:
1.核技法
2.软间隔分类器
3.SVM求解的序列最小化算法(SMO)
4.SVM应用
一.核技法
回忆一下上篇中得到的简化的最优问题,,#1:
定义函数ϕ(x)为向量之间的映射,一般是从低维映射到高维,比如在前面笔记中提到的房价和面积的关系问题中,可以定义ϕ为:
这样,就可以将#1 问题中目标函数中的内积的形式
这样就达到了将低维空间上的数据映射到高维空间上,使数据线性可分的概率变大,即不能
保证在高维上一定是线性可分的,但一般情况下高维空间上比低维空间上更加线性可分。
但有些时候,经过ϕ映射后的向量的维度过高,导致映射后向量内积的计算复杂度过高。
为了解决这个问题,我们正式引入核函数:
其中,X,Z即为上面的为了简化表示,去掉了上标。
核函数的作用在于定义了核函数后,可以不用明确的定义出映射函数,就能计算两个向量在高维空间中的内积了,而且时间复杂度低。
下面举几个核函数的例子:
其对应的映射函数为