从低维空间映射到高维空间
异或问题式线性不可分的,但是可以通过把它映射到高维度空间实现线性可分。
令ϕ(x)表示将x后的特征向量。于是,在特征空间中划分超平面所对应的模型可以表示为:
f(x)=wTϕ(x)+b
于是prototype可以表示为:
minw,b12||w||Ts.t.yi(wTϕ(xi)+b)≥1,i=1,2,…,m.
对偶问题:
maxαs.t.∑i=1mαi−12∑i=1m∑j=1mαiyiαjyjϕ(xi)Tϕ(xj)∑i=1mαiyi=0,αi≥0,i=1,2,…,m.
因为涉及到计算ϕ(xi)Tϕ(xj),这是样本映射到特征空间后的内积,由于特征空间维数可能很高,甚至可能式无穷维,因此直接计算ϕ(xi)Tϕ(xj)通常十分困难。
核函数
为了避开直接计算的障碍,可以设想一个函数。
k(xi,xj)=⟨ϕ(xi),ϕ(xj)⟩=ϕ(xi)Tϕ(xj)
即xi和xj在特征空间内的内积等于它们在原始样本空间通过函数k(⋅,⋅)计算的结果。
于是prototype可以被重写为:
maxαs.t.∑i=1mαi−12∑i=1m∑j=1mαiyiαjyjk(xi,xj)∑i=1mαiyi=0,αi≥0,i=1,2,…,m.
求解后得到:
f(x)=wTϕ(x)+b=∑i=1maiyiϕ(xi)Tϕ(xi)+b=∑i=1maiyik(xi,xj)+b(A)
定义:
这里的函数k(⋅,⋅)就是“核函数”,展开式A就是“支持向量展开式”。
核函数定理
令
K=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢k(x1,x1)⋮k(xi,x1)⋮k(xm,x1)…⋱…⋱…k(x1,xj)⋮k(xi,xj)⋮k(xm,xj)…⋱…⋱…k(x1,xm)⋮k(xi,xm)⋮k(xm,xm)⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥
常用核函数
名称 | 表达式 | 参数 |
线性核 | k(xi,xj)=xTixj | |
多项式核 | k(xi,xj)=(xTixj)d | d≥1为多项式的次数 |
高斯核 | k(xi,xj)=exp(−||xi−xj||22δ2) | δ>0为高斯核的带宽 |
拉普拉斯核 | k(xi,xj)=exp(−||xi−xj||δ) | δ>0 |
Sigmoid核 | k(xi,xj)=tanh(βxTixj+θ) | tanh为双曲正切函数,β>0,θ<0 |
核函数的组合
若k1和k2为核函数,则对于任意的正数γ1、γ2以下三种组合可以得到新的核函数:
线性组合:
γ1k1+γ2k2
核函数直积:
k1⊗k2(x,z)=k1(x,z)k2(x,z)
对任意的函数g(x):
k(x,z)=g(x)k1(x,z)g(z)