支持向量机(SVM)第一章----线性可分

本文介绍了支持向量机(SVM)的基础知识,从线性可分的情况开始,探讨如何找到最佳划分超平面。通过最大化样本到超平面的最小距离,提出目标函数并转化为凸二次规划问题。接着,利用拉格朗日乘子法构建对偶问题,并介绍SMO算法用于高效求解。最后,解释了模型参数的求解过程,指出SVM解的稀疏性及其预测效率优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以下参考周老师《机器学习》。

SVM会涉及到硬间隔、软间隔、核函数等概念,别怕,我们一步一步推进,保证可以有一个清晰的认识。

Step 1: 我们从简单的情况入手—>线性可分,即在训练集上一定可以找到一个划分超平面,将两种类别的样本分开。
(1) 问题描述:
将两种类别的样本完全分开的超平面有很多,那么哪一个超平面是最好的?


从上图可以看出,中间加粗的超平面更好,因为它不仅分对了训练样本,还对训练样本有很大的包容性,也就是说 即使训练样本发生了一定扰动,该超平面仍旧可以将它分对。

(2) 划分超平面如何表示?
可以通过如下线性方程组来描述:
wTx+b=0wTx+b=0,其中w=(w1;w2;...;wd)dw=(w1;w2;...;wd)为法向量,d是样本维度bb是位移量。
x 到平面的距离公式:
dist=|wTx+b|||w||dist=|wTx+b|||w||

(3) 根据(1)中,我们可以看出我们希望 样本中到超平面的最近距离最大化,用数学公式描述如下:
argmaxw,b(mini|wTxi+b|||w||)arg⁡maxw,b(mini|wTxi+b|||w||)
可以看到,如果找到最优的w,bw,b,我们将w,bw,b任意缩放αα后,仍然是最优的,因为分子分母都有αα,消去了。
通过一定缩放,我们令 mini|wTxi+b|=1mini|wTxi+b|=1
目标就变成了:
argmaxw,b1||w||,s.t.yi(wTxi+b)1,i=1,2,...,narg⁡maxw,b1||w||,s.t.yi(wTxi+b)≥1,i=1,2,...,n
我个人对这里目标函数的得出有点不是很透彻,起码我没有办法一下子跳到那个公式。需要绕一个大弯,我们是想从无数个w,bw,b中,找到最小距离最大化的w,bw,b,对于一对w,bw,b,将它任意放大缩小,这个超平面并没有发生变化,仍是同一个超平面。既然这样,我们就令

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值