三种SVM的对偶问题

最新推荐文章于 2024-08-30 14:01:35 发布

autocyz

最新推荐文章于 2024-08-30 14:01:35 发布

阅读量8.3k

点赞数 9

CC 4.0 BY-SA版权

分类专栏：机器学习凸优化文章标签： svm 机器学习对偶问题

本文链接：https://blog.youkuaiyun.com/autocyz/article/details/50401064

本文详细介绍了SVM的对偶问题，包括原始SVM模型、加入松弛变量后的对偶问题，以及加核函数SVM的对偶问题。通过对这些问题的探讨，阐述了SVM如何处理线性可分与不可分数据，并在高维特征空间中实现非线性分类。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、SVM原问题及要变成对偶问题的原因

对于SVM的，我们知道其最终目的是求取一分类超平面，然后将新的数据带入这一分类超平面的方程中，判断输出结果的符号，从而判断新的数据的正负。而求解svm分类器模型，最终可以化成如下的最优化问题：

min w, b s . t . 1 2 ∥ w ∥ 2 1 - y i (w \cdot x i + b) \leq 0 i = 1, 2, . . ., N

$\begin{aligned} \displaystyle{\min_{w,b}} \hspace{1cm}&{1\over 2}\parallel w \parallel ^2\\ s.t.\hspace{1cm}&1-y_i(w\cdot x_i +b)\leq 0\\ &i=1,2,...,N \end{aligned}$ 上式中，

yi $y_i$ 对应样本

xi $x_i$ 的标签。
我们的目的是求出上述最优化问题的最优解，

w∗ $w^*$ 和

b∗ $b^*$ ，从而得到分类超平面：

w * \cdot x + b * = 0

$w^*\cdot x +b^* = 0$ 进而得到分类决策函

f (x) = s i g n (w * \cdot x + b)

$f(x) = sign(w^*\cdot x+b)$ 但是在求解这一最优化问题时，求解较为困难，且对于线性不可分的数据无法得到较好的分类超平面，因此根据拉格朗日对偶性，引进原最优化问题的对偶问题，通过求解对偶问题得到原始问题的最优解。
对偶问题的引进有两个方面，一是对偶问题的求解往往比原问题容易，二是对于线性不可分的数据可以通过加松弛变量、加核函数的方法，将其推广到非线性分类。

二、原始SVM的对偶问题及其求解

原始的SVM模型的原问题如下：

min w, b s . t . 1 2 ∥ w ∥ 2 1 - y i (w \cdot x i + b) \leq 0 i = 1, 2, . . ., N

$\begin{aligned} {\min_{w,b}} \hspace{1cm}&{1\over 2}\parallel w \parallel ^2\\ s.t.\hspace{1cm}&1-y_i(w\cdot x_i +b)\leq 0\\ &i=1,2,...,N \end{aligned}$ 为方便计算，将范数形式改写成如下形式：

min w, b s . t . 1 2 w T w 1 - y i (w \cdot x i + b) \leq 0 i = 1, 2, . . ., N

$\begin{aligned} \displaystyle{\min_{w,b}} \hspace{1cm}&{1\over 2}w^Tw\\ s.t.\hspace{1cm}&1-y_i(w\cdot x_i +b)\leq 0\\ &i=1,2,...,N \end{aligned}$ 要想求原始问题的对偶问题，首先构造拉格朗日函数入如下：