SVM详细推导（包含dual-form的推导过程）

最新推荐文章于 2025-04-22 23:13:19 发布

lhz泽少

最新推荐文章于 2025-04-22 23:13:19 发布

阅读量2.3k

点赞数 7

本文链接：https://blog.youkuaiyun.com/li15006474642/article/details/104537531

版权

本文详细介绍了SVM（支持向量机）的基本概念，包括线性可分数据的分类、margin的概念及其计算，以及SVM的目标函数。通过引入软间隔最大化处理非理想情况，并探讨了从原始问题到对偶问题的转换，包括拉格朗日乘子法和KKT条件。最后，讨论了SVM如何通过核函数处理非线性问题，以降低计算复杂度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

线性可分

SVM关于二分类问题的算法，也就是将一组数据线性的分成两类，什么是线性的分成两类呢？就是像图（1）这样的数据用一条线可以进行一分为二。

在这里插入图片描述
像图（2）这种数据使用一条线是分不开的，那么这种数据就成为线性不可分的数据，对于这种数据SVM就没有办法了吗？当然有办法了不然也不会在早期这么流行的。

SVM

margin的概念

假设现在有这样一组数据， $D=\{(x_1,y_1),(x_2,y_2),(x_3,y_3)...(x_n,y_n)\}，$ 其中 $x$ 表示数据， $y$ 表示对应的标签， $y\in\{1,-1\}$ 现在用图（3）来表示：

在这里插入图片描述
现在用一条线来区分，假设这条线为： $W^Tx_i+b$ 来表示，也就是说 $W^Tx_i+b\geq0$ 时 $， y = 1 ，$ $W^Tx_i+b\leq0$ 时 $， y = - 1$ 也可以用 $(W^Tx_i+b)\cdot y\geq0$ 来表示。

图（4）表示的是我们使用了 ①，②和③条作为决策边界来进行将数据分类，从图中我们明显看到这三条线都成功的将数据进行了分类，但是那个分类的最好呢，答案是②，①和③距离数据太近了，有可能造成误判，并且很容易过拟合，对于②来说我们离数据的距离比较远，增加一些噪音的话也是可以保证分类的正确性。
在这里插入图片描述
因此我们通常把这个距离叫做margin。我们的分类器离数据的距离越大越好，所以margin的目标就是最大化margin。