支持向量机SVM(Support Vector Machine)

本文深入探讨了逻辑回归(Logistic Regression)与支持向量机(Support Vector Machine)两种分类算法的区别,详细解释了逻辑回归的基本原理及SVM中函数间隔、几何间隔的概念,并给出了SVM的对偶问题推导。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.前言

1.1 逻辑回归 Logistic Regression

LR是一种线性二分类方法。logistic函数(或sigmoid函数)将自变量 x(,+) 映射到 (0,1) 上,即映射后到值被认为是属于y=1的概率。Sigmoid函数表示为:

hθ(x)=g(θTx)=11+eθTx

其中, hθ(x)(0,1).
P(y=1|x;θ)=hθ(x)

P(y=0|x;θ)=1hθ(x)

逻辑回归的目的在于学习得到θ,使y=1对应的特征 θTx>>0y=0对应的特征 θTx<<0
SVM与LR不同在于:SVM考虑局部(不关心已经确定远离的点);LR考虑全局(考虑远离的点可能通过调整中间线使其更加远离)。

1.2 函数间隔与几何间隔

函数间隔与几何间隔
给定一个训练样本(x(i),y(i)),x为特征,y是结果便签。函数间隔定义如下:

γ̂ =y(i)(wTx(i)+b)

全局样本上的函数间隔
γ̂ =mini=1,,mγ̂ (i)

A点至分割平面(线)的距离为A点(x(i),y(i))至B点的距离,B点的x=x(i)γ(i)w||w||,代入wTx+b=0得,
γ(i)=(w||w||)Tx(i)+b||w||
则几何间隔定义为
γ(i)=y(i)((w||w||)Tx(i)+b||w||)

类似全局的几何间隔为
γ=mini=1,,mγ(i)

1.3 最优间隔分类器(optimal margin classifier)

最优间隔分类器形式化表示为:

maxγ,w,bγs.t.y(i)(wTx(i)+b)γ,i=1,,m||w||=1

等同于
maxγ,w,bγ||w||s.t.y(i)(wTx(i)+b)γ||w||,i=1,,m||w||=1

如果我们将全局的函数间隔定义为1,也即是将离超平面最近的点的距离定义为1||w||,则上式等同于
maxγ,w,b1||w||s.t.y(i)(wTx(i)+b)1||w||,i=1,,m||w||=1

也可以写为
minw,b12||w||2s.t.y(i)(wTx(i)+b)1,i=1,,m

1.4 拉格朗日对偶(Lagrange Duality)

情况一:对于如下的等式约束的二次规划问题:

minwf(w)s.t.hi(w)=0,i=1,,l.

构造如下拉格朗日公式
L(w,β)=f(w)+i=1lβihi(w)

其中,l 为等式约束的个数。则
minwf(w)=minw,βL(w,β)

而通过Lw=0可求得原命题的极值。
情况二:对于含有不等式约束的极值问题:
minwf(w)s.t.gi(w)0,i=1,,k.hi(w)=0,i=1,,l.

构造如下拉格朗日公式
L(w,α,β)=f(w)+i=1kαigi(w)+i=1lβihi(w)

其中,αi0(i=1,,k),可以得到
f(w)=maxα,β:αi0L(w,α,β)


minwf(w)=minwmaxα,β:αi0L(w,α,β)maxα,β:αi0minwL(w,α,β)

当以下KTT条件满足时,上式等价,即对偶问题是原问题的解,KTT条件分别为
wiL(w,α,β)=0i=1,,n(1)βiL(w,α,β)=0i=1,,l(2)αigi(w)=0i=1,,k(3)gi(w)0i=1,,k(4)alpha0i=1,,k(5)

2. SVM对偶问题

SVM原优化问题为:

minw,b12||w||2s.t.y(i)(wTx(i)+b)1,i=1,,m

构造其拉格朗日函数:
L(w,b,α)=12||w||2i=1mαi[y(i)(wTx(i)+b)1]

Lwb分别求偏导数:
wL(w,b,α)=wi=1mαy(i)x(i)=0

w=mi=1αy(i)x(i)
bL(w,b,α)=i=1mαy(i)=0

mi=1αy(i)=0
w=mi=1αy(i)x(i)mi=1αy(i)=0代入到L(w,b,α)得到
L(w,b,α)=i=1mαi12i,j=1my(i)y(j)αiαj(x(i))Tx(j)

综合可知,SVM的对偶问题为
maxαi=1mαi12i,j=1my(i)y(j)αiαj(x(i))Tx(j)s.t.αi0i=1,,mi=1mαiy(i)=0

求出αi,则可求出w=mi=1αy(i)x(i)
b=maxi:y(i)=1wTx(i)+mini:y(i)=1wTx(i)2
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值