支持向量机笔记-软间隔支持向量机

支持向量机概述

支持向量机的基础是定义在特征空间上的间隔最大的线性分类器。

当训练数据线性可分时,通过硬间隔最大化学习一个线性分类器;当训练数据近似线性可分时,通过软间隔最大化学习一个线性分类器;当训练数据线性不可分时,通过使用核技巧及软间隔最大化,学习非线性支持向量机。

符号定义

考虑二分类问题。

训练数据集:

T={(x1,y1),(x2,y2),...,(xN,yN)}

其中, xiRn,yi{+1,1},i=1,2,...,N ,假设训练集是线性可分的。

超平面公式:

wx+b=0

其中, w 是法向量,b是截距。

硬间隔支持向量机

此文假设读者已经了解硬间隔支持向量机,如不了解,可参考支持向量机笔记-硬间隔支持向量机

软间隔支持向量机

当训练样本近似线性可分时,即大部分样本线性可分,少数样本线性不可分时,就用到软间隔支持向量机。

对应的最优化问题

回顾硬间隔支持向量机的优化问题

硬间隔支持向量机对应的最优化问题最终形式为:

minw,b 12||w||2

s.t. yi(wxi+b)10,i=1,2,...,N

如不了解来由,可参考 支持向量机笔记-硬间隔支持向量机

改进以获得软间隔支持向量机优化问题

上面两个式子中,限制条件 yi(wxi+b)10 中的 yi(wxi+b) 含义为样本 (xi,yi) 到超平面 (w,b) 的函数距离,此限制条件的意思是要求所有样本点到超平面的函数距离都得 大于等于1;

这在存在少量线性不可分样本的情况下做不到,因此作出改进。

既然有样本做不到,那就放宽要求,每个样本 (xi,yi) 加一个松弛变量 ξi0 ,要求所有样本不必大于等于 1 ,只需要大于等于 1ξi

每个样本都有一个松弛变量,那么这些松弛变量应该取什么值?这些值并非人工指定的,而是需要求解的,那么必须在代价函数中对这些变量加以限制,限制方式是:

minw,b 12||w||2+Ci=1Nξi

其中 C>0 被称为惩罚参数, C 越大对错分类样本的惩罚越大,惩罚越大错分样本数量倾向于减少。

在上面式子中,minw,b 12||w||2可以使得超平面和训练集的“间隔”(这个间隔的概念请参考 支持向量机笔记-硬间隔支持向量机中的几何间隔)尽可能大; CNi=1ξi 可以使得错分的样本数尽可能少。

优化问题最终形式

minw,b 12||w||2+Ci=1Nξi

s.t. yi(wxi+b)1ξi,i=1,2,...,N

s.t. ξi0,i=1,2,...,N

学习超平面的算法

分3步:
1. 选定惩罚参数 C ,构造并求解:

minα12i=1Nj=1Nαiαjyiyj(xixj)i=1Nαi

s.t.i=1Nαiyi=0

0αiC,i=1,2,...,N

求得最优解 α=(α1,α2,...,αN)T
2. 用以下公式计算
w=i=1Nαiyixi

选择 α 的一个正分量 0<αj<C ,找到 yj
b=yji=1Nαiyi(xixj)

3. 获得超平面方程以及决策函数
wx+b=0

分类决策函数:
f(x)=sign(wx+b)

算法的原理

首先,原始问题是:

minw,b 12||w||2+Ci=1Nξi

s.t. yi(wxi+b)1ξi,i=1,2,...,N

s.t. ξi0,i=1,2,...,N

这是个约束优化问题,可以使用拉格朗日对偶性来求解。

首先构建拉格朗日函数:

L(w,b,ξ,α,μ)=12||w||2+Ci=1Nξii=1Nαi(yi(wxi+b)1+ξi)i=1Nμiξi

其中, αi0,μi0

原始问题的对偶问题是拉格朗日函数的极大极小问题。

可以通过求解这个问题来获得原始问题的解:

maxαminw,b,ξL(w,b,ξ,α,μ)

  1. minw,b,ξL(w,b,ξ,α,μ)
    L(w,b,α) 分别对 w,b,ξ 求偏导并令其等于0。
    wL(w,b,ξ,α,μ)=wi=1Nαiyixi=0

bL(w,b,ξ,α,μ)=i=1Nαiyi=0

ξL(w,b,ξ,α,μ)=Cαiμi=0

得:
w=i=1Nαiyixi

i=1Nαiyi=0

Cαiμi=0

将它们代入拉格朗日函数 L(w,b,ξ,α,μ) ,得:

minw,b,ξL(w,b,ξ,α,μ)=12i=1Nj=1Nαiαjyiyj(xixj)+i=1Nαi

2. 求 maxαminw,b,ξL(w,b,ξ,α,μ)
maxαminw,bL(w,b,α)=maxα12i=1Nj=1Nαiαjyiyj(xixj)+i=1Nαi

s.t.i=1Nαiyi=0

s.t.Cαiμi=0

s.t.αi0,i=1,2,...,N

s.t.μi0,i=1,2,...,N

后3个限制条件可以用:

0αiC

等效替换。

最终形式

minα12i=1Nj=1Nαiαjyiyj(xixj)+i=1Nαi

s.t.i=1Nαiyi=0

s.t.0αiC

然后就去解吧。。。各种代入和求导取零,解 α 就是了,解出来 α 再利用步骤1求导数置0得到的的结论求 w,b

软间隔支持向量机的支持向量

对分类超平面的选取没有任何影响的样本点不叫“支持向量”。
对分类超平面的选取有影响的样本点叫“支持向量”。

软间隔的支持向量包括:
1. “间隔边界”上的样本。
2. “间隔边界”之间的样本。
3. 错分的样本。

“间隔边界”是指:
距离超平面函数距离为 1 (几何距离为1||w||)的两个平行超平面。

说明

如有错误,敬请指正。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值