介绍支持向量机的博文很多,不再赘述。仅记录两个问题。
问题一
假设超平面(w,b) 能将训练样本正确分类,对(xi,yi)∈D,若yi=+1,则wTxi+b>0;
若yi=−1,则wTxi+b<0。有:
{wTxi+b≥+1,yi=+1;wTxi+b≤−1,yi=−1;
刚开始没有想明白为什么是 ≤−1或者≥+1 ,为什么不能是其他数值。
其实,这里wT和b 都还是未知数,本来就是要计算的。例如可以这样写:
不论是±1还是±2都是可以的,为了方便表示,选择1。
问题二
为了找到最大间隔,就是要:
maxw,b2||w||s.t. yi(wTxi+b)≥1,i=1,..,m
刚开始没有想明白为什么约束条件是 yi(wTxi+b)≥1。为什么是 1,而不是 0。
这里的 yi∈{−1,+1},而 wTxi+b=±1是支持向量所在的直线,所以最小值就是1。
通过拉格朗日乘子法,可以得到上式得对偶问题:
maxα∑i=1mαi−12∑i=1m∑j=1mαiαjyiyjxTixjs.t. ∑i=1mαiyi=0, αi≥0,i=1,..,m.
这个过程要满足 KKT条件:
⎧⎩⎨⎪⎪αi≥0;1−yif(i)≤0;αi(yif(x)i)−1)=0;
总会有αi=0或yif(xi)=1。αi不能为0,于是yif(xi)=1。于是对应的样本点就在最大间隔的边界上,就是一个支持向量。
问题三
拉格朗日乘子法可将d个变量与
拉格朗日函数的理解:
L(x,λ)=f(x)+λg(x)
分别对x,λ求导:
∂L(x,λ)∂x=∇f(x)+λ∇g(x)=0∂L(x,λ)∂λ=g(x)=0
于是原问题可以转化为对拉格朗日函数的无约束优化问题。
本文探讨了支持向量机(SVM)中的关键概念,包括为何超平面的约束条件为±1,如何寻找最大间隔,以及拉格朗日乘子法的应用。详细解析了SVM在分类任务中确定最优超平面的过程。
2930

被折叠的 条评论
为什么被折叠?



