支持向量机(SVM)原理与公式推导

一. SVM简介

支持向量机一般用于解决二分类问题,即给定数据集T={(x1x_1x1,y1y_1y1),(x2x_2x2,y2y_2y2),(x3x_3x3,y3y_3y3)…},找到一个可以分开数据集的超平面:w∗⋅x+b∗=0(式 1.1)w^* \cdot x+b^*=0\qquad (式 \ 1.1)wx+b=0( 1.1)此最优超平面应当使支持向量到超平面上的几何间隔d最大。
在这里插入图片描述
如上图所示,在向量空间中构造三个相互平行的超平面F,Fa,Fb。一般将离超平面F最近的一些样本点称之为支持向量(Support Vector),由支持向量约束构成的超平面Fa,Fb称为支持超平面。由于在超平面F与样本集均确定的条件下,所有支持向量也是确定的,在训练过程中需要计算所有支持向量到超平面F的几何间隔d。

二. 将几何间隔最大值问题转化为最小值问题

几何间隔ddd与间隔uuu可以用以下公式计算,其中(x,y)(x,y)(x,y)为样本点:d=y⋅(w∗⋅x+b∗)⋅1∣∣w∣∣(式 2.1)d=y\cdot (w^* \cdot x+b^*)\cdot \frac{1}{||w||}\qquad (式 \ 2.1)d=y(wx+b)w1( 2.1)u=y⋅(w∗⋅x+b∗)(式 2.2)u=y\cdot (w^* \cdot x+b^*)\qquad (式 \ 2.2)u=y(wx+b)( 2.2)yyy表示数据标签,在二分类问题中一般为1/-1,这样定义后,不论样本点在超平面的哪一侧,都能保证uuu总为正数。在实际使用中,为了方便计算,通常固定间隔u=1u=1u=1,这样,求ddd的最大值问题变为求∣∣w∣∣||w||w的最小值问题,于是可以转化为求解如下的二次规划问题:min⁡w,b12∣∣w∣∣2(式 2.3)\min_{w,b}\frac{1}{2}||w||^2\qquad (式 \ 2.3)w,bmin21w2( 2.3)条件:yi⋅(w⋅xi+b)−1=0,i=1,2,...,N条件:y_i\cdot (w\cdot x_i+b)-1=0,i=1,2,...,Nyi(wx

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值