线性可分支持向量机最大间隔唯一性证明

本文证明了线性可分支持向量机最大间隔解的唯一性。通过构造新的解并利用最优化原理,证明了任意两个最优解在权重向量上的等价性,并进一步证明了偏置项的等价性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

线性可分支持向量机最大间隔唯一性证明

《统计学习方法》定理7.1中 唯一性的证明:

假设问题(7.13)~(7.14)存在两个最优解(w1,b1w1∗,b1∗)和(w2,b2w2∗,b2∗),则 w1w2w1∗和w2∗的长度相同,即 ||w1||=||w2||=c||w1∗||=||w2∗||=c,其中c是一个常数。令 w=w1+w22w=w1∗+w2∗2b=b1+b22b=b1∗+b2∗2,将(w1,b1w1∗,b1∗)和(w2,b2w2∗,b2∗)分别带入到式(7.14) yi(wxi+b)1>=0yi(w⋅xi+b)−1>=0,有yi(w1xi+b1)1>=0yi(w1∗⋅xi+b1∗)−1>=0yi(w2xi+b2)1>=0yi(w2∗⋅xi+b2∗)−1>=0
两式相加除以2,就有yi(w1+w22xi+b1+b22)1>=0yi(w1∗+w2∗2⋅xi+b1∗+b2∗2)−1>=0。所以,(w, b)是问题(7.13)~(7.14)的可行解,从而有

c||w||12||w1||+12||w2||=cc≤||w||≤12||w1∗||+12||w2∗||=c

上式表明,||w||=12||w1||+12||w2||=c||w||=12||w1∗||+12||w2∗||=c,如果有w1=λw2w1∗=λw2∗,则式||w||=12||w1||+12||w2||||w||=12||w1∗||+12||w2∗||会等价于|λ+1|||w2||2=|λ|2||w2||+12||w2|||λ+1|⋅||w2∗||2=|λ|2||w2∗||+12||w2∗||,又因为w1w2w1∗和w2∗要满足式(7.13)使||w||2||w||2最小,所以λ=1λ=1,即w1=w2w1∗=w2∗
由此两个最优解(w1,b1w1∗,b1∗)和(w2,b2w2∗,b2∗)可以写为(w,b1w∗,b1∗)和(w,b2w∗,b2∗)。

再证b1=b2b1∗=b2∗
x1x2x1′和x2′是集合{xi|yi=+1}{xi|yi=+1}中分别对应于(w,b1w∗,b1∗)和(w,b2w∗,b2∗)使得问题(7.14)的不等式等号成立的点,x′′1x′′2x1″和x2″是集合{xi|yi=1}{xi|yi=−1}中分别对应于(w,b1w∗,b1∗)和(w,b2w∗,b2∗)使得问题(7.14)的不等式等号成立的点,则有方程组
(1) 1(wx1+b1)1=01⋅(w∗⋅x1′+b1)−1=0
(2) 1(wx2+b2)1=01⋅(w∗⋅x2′+b2)−1=0
(3) (1)(wx′′1+b1)1=0(−1)⋅(w∗⋅x1″+b1)−1=0
(4) (1)(wx′′2+b2)1=0(−1)⋅(w∗⋅x2″+b2)−1=0
(1)-(3),得到 b1=12(wx1+wx′′1)b1=12(w∗⋅x1′+w∗⋅x1″)
(2)-(4),得到 b2=12(wx2+wx′′2)b2=12(w∗⋅x2′+w∗⋅x2″)
两式相减,得

b1b2=12[w(x1x2)+w(x′′1x′′2)]b1∗−b2∗=−12[w∗⋅(x1′−x2′)+w∗⋅(x1″−x2″)]

又因为
(wx2+b1)>=1=(wx1+b1)(w∗⋅x2′+b1)>=1=(w∗⋅x1′+b1)
(wx1+b2)>=1=(wx2+b2)(w∗⋅x1′+b2)>=1=(w∗⋅x2′+b2),所以有
w(x2x1)>=0w∗(x2′−x1′)>=0w(x1x2)>=0w∗(x1′−x2′)>=0,则 w(x1x2)=0w∗(x1′−x2′)=0。同理有w(x′′1x′′2)=0w∗(x1″−x2″)=0
因此,b1b2=0b1∗−b2∗=0,即b1=b2b1∗=b2∗
所以最优解是唯一的。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值