(LXTML笔记)关于支持向量机[二]

通过对原始支持向量机(SVM)问题引入对偶问题,本文详细解释了如何简化复杂度,使其与数据数量相关而非特征维度。通过拉格朗日乘子法去除约束条件,并利用强对偶性原理,最终将问题转化为仅与拉格朗日乘子相关的最优化问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

下面讨论的是对偶支持向量机,先看引入
这里写图片描述
由上一节我们知道,朴素支持向量机可以通过二次规划来直接解决,但是我们假设xx本身是一个d维的向量,然后由于可能有复杂边界,所以我们常常要讲xx转换到Z空间上,通过zn=ϕ(xn)zn=ϕ(xn)来实现,在实际中这里的ϕϕ往往是升维度的,因为一般是不可线性可分,然后(比如)高维的时候就变成线性可分了,不妨比如如

ϕ(x)=(x21,x1x2,x1x3....xdx1,xdx2,...x2d),ϕ(x)=(x12,x1x2,x1x3....xdx1,xdx2,...xd2),

这样的话复杂度(如内积)完全取决于ϕϕ的形式,这里变成了至少O(d2)O(d2),这给二次规划带来了巨大的压力,那么此时我们引入SVM的对偶问题

将SVM的复杂度变为和数据的数量相联系

这里写图片描述

和正则化那一节类似地,我们可以考虑如下拉格朗日函数,企图将约束条件去掉,塞进最优化部分。
这里写图片描述

最优化问题变为了

minb,w(maxan0{L(b,w,a)}),minb,w(maxan≥0{L(b,w,a)}),

这个操作也是迫使向的,假设有一个(b,w)(b,w)不满足限制条件,那么就是说yn(wTzn+b)<1yn(wTzn+b)<1,所以容易知道(maxan0{L(b,w,a)})+(maxan≥0{L(b,w,a)})→+∞,而假设全部的(b,w)(b,w)都满足限制条件的话,那么容易知道(maxan0{L(b,w,a)})=wTw(maxan≥0{L(b,w,a)})=wTw,这和我们原来的最优化目标是一样的。

至此,我们去掉了限制条件,下面引入对偶问题,我们知道对于

minb,w(maxan0{L(b,w,a)}),minb,w(maxan≥0{L(b,w,a)}),

固定aa的话,我们轻松得到:
这里写图片描述
由于对任何固定a都成立,那么我们对右边的aa取最大仍是成立的,我们得到了minmaxmaxmin的结论,如下图
这里写图片描述
如果上面的这个大于等于号是等号就好了,而最优化里有这样的一个结论:
这里写图片描述
对于二次规划问题,如果
  • 凸函数
  • 可分的
  • 限制条件是线性的

那么称上述对偶问题为强对偶问题,存在一组(b,w,a)(b,w,a)使得两边都成立,即等号成立,即解左右两边都是一样的。下面我们来看右边的对偶问题能带来什么便利,

整理一下,现在问题变为
这里写图片描述
考虑取到最小值时候的费马点条件,对wwb进行求导,然后将这些必要条件放在限制条件上有
这里写图片描述
这样下来,我们可以看到我们已经去掉了”minmin”了,此时最优化目标仅仅与aa有关,总结一下既有
这里写图片描述
上述中的4点展示的是KKT条件(不过略强,实际上可以稍微放松一点条件),第四点是上文中关于

minb,w(maxan0{L(b,w,a)}),

的描述所保证的。
这里写图片描述

依旧采用二次规划的问题的方法即可
这里写图片描述
要还原回原来的(w,b)(w,b)的话,在求得所有的anan后,由我们最优条件的w=anynzn)w=∑anynzn)可以获得ww,而由于有an(1yn(wTzn+b))=0,所以我们只需要找到一个非零的anan就可以得到我们要的bb,特别地我们可以观察到,实际上,整个问题只和非零的an有关系,之前上文中将在“胖边界”上的点成为“支持向量”,而此时我们可以更进一步地加强,称这些对应an0an≠0的点称为“支持向量”
这里写图片描述
再次将朴素SVM和对偶SVM放在一起对比 有:
这里写图片描述

这里表面上在计算对偶SVM时候,隐藏了xnxn的维度dd,但是实际上,这部分的计算蕴含在矩阵Q中,计算这个QQ并不容易,下一节,将讲到如何应用“核函数”技巧来化简计算量,让SVM能落实到应用中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值