支持向量机(SVM)第一章----线性可分_第1关:线性可分支持向量机-优快云博客

本文介绍了支持向量机（SVM）的基础知识，从线性可分的情况开始，探讨如何找到最佳划分超平面。通过最大化样本到超平面的最小距离，提出目标函数并转化为凸二次规划问题。接着，利用拉格朗日乘子法构建对偶问题，并介绍SMO算法用于高效求解。最后，解释了模型参数的求解过程，指出SVM解的稀疏性及其预测效率优势。

以下参考周老师《机器学习》。

SVM会涉及到硬间隔、软间隔、核函数等概念，别怕，我们一步一步推进，保证可以有一个清晰的认识。

Step 1: 我们从简单的情况入手—>线性可分，即在训练集上一定可以找到一个划分超平面，将两种类别的样本分开。
(1) 问题描述：
将两种类别的样本完全分开的超平面有很多，那么哪一个超平面是最好的？

从上图可以看出，中间加粗的超平面更好，因为它不仅分对了训练样本，还对训练样本有很大的包容性，也就是说即使训练样本发生了一定扰动，该超平面仍旧可以将它分对。

(2) 划分超平面如何表示？
可以通过如下线性方程组来描述：
$w^Tx + b =0$ ，其中 $w=(w_1;w_2;...;w_d) 为法向量，d是样本维度$ ， $b$ 是位移量。
点 $x$ 到平面的距离公式：
$dist = \frac{|w^Tx+b|}{||w||}$

(3) 根据(1)中，我们可以看出我们希望样本中到超平面的最近距离最大化，用数学公式描述如下：
$\arg \max\limits_{w,b} (\min\limits_i \frac{|w^Tx_i+b|}{||w||})$
可以看到，如果找到最优的 $w,b$ ,我们将 $w,b$ 任意缩放 $\alpha$ 后，仍然是最优的,因为分子分母都有 $\alpha$ ,消去了。
通过一定缩放，我们令 $\min\limits_i |w^Tx_i+b|=1$
目标就变成了：
$\arg \max\limits_{w,b} \frac{1}{||w||}, s.t. y_i(w^Tx_i+b)\geq1,i=1,2,...,n$
我个人对这里目标函数的得出有点不是很透彻，起码我没有办法一下子跳到那个公式。需要绕一个大弯，我们是想从无数个 $w,b$ 中，找到最小距离最大化的 $w,b$ ,对于一对 $w,b$ ,将它任意放大缩小，这个超平面并没有发生变化，仍是同一个超平面。既然这样，我们就令