支持向量机浅析(1)：训练数据线性可分时的算法

最新推荐文章于 2024-06-18 10:32:35 发布

原创最新推荐文章于 2024-06-18 10:32:35 发布 · 1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#SVM #支持向量机 #算法 #机器学习

机器学习专栏收录该内容

52 篇文章

订阅专栏

本文探讨如何通过支持向量机寻找最优分割直线，以实现不同类别间的最大间隔。通过数学模型建立二次规划问题，并简要介绍求解思路。

例子
　　给定数据 $x^i$ 和标签 $y^i$ ，比如：

$x^i$	$y^i$
(2,3)	-1
(3,2)	-1
(5,7)	+1
(8,9)	+1

　　如何寻找一条直线

w 1 x 1 + w 2 x 2 + b = 0 (1)

$w_1x_1+w_2x_2+b=0\tag{1}$
把这组点分开，使得两类之间间隔最大？

　　这个问题可归结为寻找分割线： $wx+b=1$ 和 $wx+b=-1$ 。我们假设每个点都有标签 $y^i$ ，满足下面约束条件：
　　对于所有使 $y^i=1$ 的上标 $i$ ，有 $wx^i+b\ge1$ ;
　　对于所有使 $y^i=-1$ 的上标 $i$ ，有 $wx^i+b\le-1$ 。
　　该约束条件等价于：

y i (w x i + b) \geq 1, i = 1, 2, . . ., l (2)

$y^i(wx^i+b)\ge1, \ i = 1,2,...,l\tag{2}$

数学模型

　　由于直线 $wx+b=1$ 和 $wx+b=-1$ 之间的距离：

d = 2 w 2 1 + w 2 2 - - - - - - - \sqrt

$d=\frac2{\sqrt{w_1^2+w_2^2}}$
　　间隔最大化实际上就是

2w21+w22√ $\frac2{\sqrt{w_1^2+w_2^2}}$ 最大化，也就是

w21+w22 $w_1^2+w_2^2$ 最小化。就本文例子来看，约束方程如下：

min s . t . w 21 + w 22 - 2 w 1 - 3 w 2 - b - 3 w 1 - 2 w 2 - b 7 w 1 + 8 w 2 + b 8 w 1 + 9 w 2 + b \geq \geq \geq \geq 1111 (3)

$\tag{3} \begin{array}\\ \min & w_1^2+w_2^2\\ s.t. \\ &-2w_1-3w_2-b &\ge& 1\\ &-3w_1-2w_2-b &\ge& 1\\ &7w_1+8w_2+b &\ge& 1\\ &8w_1+9w_2+b &\ge& 1\\ \end{array}$
　　显然这是二次规划问题。

　　习惯上，支持向量机的规划模型表述为下述形式：

min 1 2 ∥ w ∥ 2 s . t ., y i (w x + b i) \geq 1, i = 1, 2, . . ., n (4)

$\tag4 \min \frac12\|\textbf w\|^2 \ s.t., y_i(\textbf w \textbf x+ b_i) \ge 1, i=1,2,...,n$ 　　

二次规划求解方法

　　不打算太过正式讨论二次规划求解方法，等我有时间全面搜集一下素材，专门讨论一下。二次规划求解算法的开源代码应该也容易找到，可能根本不需要自己动手写这些代码。这里简单说一下基本思路，不一定真有用，只能解决有强迫症的读者的思想性疑问。支持向量机给出的二次规划模型有一定特殊性，我会另写文章分析更好的求解方法。

　　对于数学规划问题而言，如果最优解落在可行域内部，则最优解通常是目标函数的无约束极值之一；否则，最优解应该落在可行域边界。如果不考虑(2)式的约束条件，它的唯一的一个无约束极值点显然是 $w_1=0,w_2=0$ 。依据(1)式，显然 $b=0$ ，这显然不符合后面的约束条件。好吧，既然无约束极值点落在了约束条件之外，那么，规划(3)的最优解一定落在可行域的边界上。比如第一条边界上的最优解可通过下面规划问题求得：