离群点
对于(1)中的SVM模型而言,如果在分类的数据集中出现了离群点,必定会造成超平面的移动。如果数据集中出现了离群点,模型应该有一定的容错能力,于是就有了加入松弛变量的新目标函数:
minw,b12||w||2+C∑m1ξi,s.t.yi(wTxi+b)≥1−ξi,ξi≥0;i=1,..m;
如果离群点越多,C∑m1ξi将越大,于是整个12||w||2则相应地需要变小。C越大,表面少许离群点的影响都将非常大,意味对离群点的容忍度越低。
对应的拉格朗日公式:
L(w,b,α,ξ,β)=12||w||2+C∑m1ξi−∑m1αi[yi(wTxi+b)−1+ξi]−∑m1βiξi
同样在满足KKT条件下:
∂L(w,b,α,ξ,β)∂w=w−∑m1αiyixi=0
∂L(w,b,α,ξ,β)∂b=∑m1αiyi=0
∂L(w,b,α,ξ,β)∂ξi=C−αi−βi=0
αi[yi(wTxi+b)−1+ξi]=0
αi≥0
βi≥0
βiξi=0
那么:
L(w,b,α,ξ,β)=12||w||2+C∑m1ξi−∑m1αi[yi(wTxi+b)−1+ξi]−∑m1βiξi=12wTw−∑m1αi[yi(wTxi+b)−1]+C∑m1ξi−∑m1αiξi−∑m1βiξi
因为C−αi−βi=0,
所以C∑m1ξi−∑m1αiξi−∑m1βiξi=C∑m1ξi−∑m1(αi+βi)ξi=0
又因为βi≥0,C−αi=βi≥0
所以 0≤αi≤C
最终可以得到:
max∑m1αi−1/2∑m1αiαjyiyj(xi,xj)s.t.0≤αi≤C,∑m1αiyi=0