机器学习——支持向量机(SVM)

支持向量机(Support Vector Machine,SVM)是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线,它们之间的边距最大。为此,我们将数据项绘制为 n 维空间中的点,其中,n 是输入特征的数量。在此基础上,支持向量机找到一个最优边界,称为超平面(Hyperplane),它通过类标签将可能的输出进行最佳分离。


首先来了解一下什么是支持向量,下面举一个简单的例子。

img

如上图,对于一个二分类场景,可以有无数线将其分开。被虚线截到的一个或者多个样本就叫做支持向量。


1.1 线性可分的SVM

如果有一个线性函数能够将样本分开,就称这些数据样本是线性可分的。线性函数,简单说来,在二维空间中就是一条直线,三维空间中就是一个平面。高于三维,我们统称为 超平面

关于上面图中存在的一个问题:就是可以有无数条直线将样本分开,所以需要找出一条可以正确分开样本并且结果是最优的。

最优化的原则就是所有的样本能正确分类并且不同样本之间的间隔要最大。转化为所有的支持向量到线性函数(超平面)的距离最大,这样就能保证最优结果,并且此结果下只可能有一条最优线将样本分开。

![在这里插入图片描述](https://img-blog.csdnimg.cn/c66bf52ef35c496eb85de79f7c9725dd.png#pic_center
在这里插入图片描述

接下来应该要怎样计算间隔呢?

用如下线性方程来描述超平面 WT x+b=0; 其中W为法向量,决定了超平面的方向,b为位移量,决定了超平面与原点的距离。假设对于样本(xi,yi),用yi =+1来表示正样本,yi =-1来表示负样本。(当然可以的+1,-1不是肯定的,你也可以取2,3,4… -2,-3,-4…).说明一下:yi 是标签值。可以得到如下图结果:

image-20220613194803782

通过放缩,可以使在支持向量x0上有|wTx0+b| = 1,而在非支持向量上有|wTx0+b| >1.

所有有一个支持向量点x0到超平面的距离:
d = ∣ w T x 0 + b ∣ ∣ ∣ w ∣ ∣

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值