机器学习——第六章 支持向量机

目录

6.1 间隔和支持向量

6.2 对偶问题

6.3 核函数

6.4 软间隔与正则化

6.5 支持向量回归

6.6 核方法

6.7 阅读材料


6.1 间隔和支持向量

给定训练样本集D=\left \{ (x_{1},y_{1}),(x_{2},y_{2}),...,(x_{m},y_{m}) \right \},y_{i}\in \left \{ -1,+1 \right \},分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开,但能将训练样本分开的划分超平面可能有很多,如下所示:

直观上看,应该去找位于两类训练样本“正中间”的划分超平面,该超平面对训练样本局部扰动的“容忍”性最好,也就是该划分超平面所产生的分类结果是最鲁棒的,对未见示例的泛化能力最强。划分超平面的线性方程如下所示: 

\omega ^{T}x+b=0

其中\omega =(\omega _{1};\omega _{2};...;\omega _{d})为法向量,决定了超平面的方向;b bb为位移项,决定了超平面与原点之间的距离,下面定义样本空间中任意点x xx到超平面( ω , b )的距离,如下所示: 

r=\frac{|\omega ^{T}x+b|}{||\omega ||} 

假设超平面( ω , b ) 能将训练样本正确分类,有如下定义: 

\left\{\begin{matrix} \omega ^{T}x_{i}+b\geq +1,y_{i}=+1\\ \omega ^{T}x_{i}+b\leq +1,y_{i}=-1 \end{matrix}\right. 

 如下图所示,距离超平面最近的这几个训练样本点使上式的等号成立,这些点被称为“支持向量”,两个异类支持向量到超平面的距离之和为\gamma =\frac{2}{||\omega ||},也被称为“间隔”。

欲找到具有“最大间隔”的划分超平面,需要找到满足约束条件的参数ω和b,使得γ最大,即 

最大化{\left\| \omega \right\|^{ - 1}} ,等价于最小化{\left\| \omega \right\|^2},于是得到如下表达,这也是支持向量机的基本型。 

虽然间隔看着貌似只与ω有关,但实际上b bb通过约束隐式地影响着ω的取值,因为这些支持向量是使得等号成立的样本点,所以如果b发生变化,那么ω也会发生变化。 

6.2 对偶问题

 SVM基本型的对偶问题是将原始问题的最小化目标函数转换为最大化拉格朗日函数,利用拉格朗日对偶性,求解出拉格朗日乘子,从而得到超平面的参数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值