王小草【机器学习】笔记--支持向量机SVM

最新推荐文章于 2025-04-14 00:03:29 发布

王小小小草

最新推荐文章于 2025-04-14 00:03:29 发布

阅读量6.4k

点赞数 7

分类专栏：王小草机器学习笔记

本文链接：https://blog.youkuaiyun.com/sinat_33761963/article/details/53520968

版权

本文详细介绍了支持向量机（SVM）的原理，包括分割超平面、线性可分支持向量机的构建，以及软间隔最大化的目标函数。讲解了SVM的计算过程，包括目标函数的推导、转换和求解，并引入了核函数的概念，特别是高斯核的作用。最后简要提及了SMO算法用于求解SVM的优化问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

标签（空格分隔）：王小草机器学习笔记

1.SVM的原理与目标

1.1 分割超平面

QQ截图20161119153254.png-19.9kB

来看上图，假设C和D是两个不想交的凸集，则存在一个超平面P，这个P可以将C和D分离。

image_1b1to6btfmb7160310if21ilam12.png-7.2kB

这两个集合的距离，定义为两个集合间元素的最短距离。

做集合C和集合D最短线段的垂直平分线。这条垂直平分线就是分割超平面。

在两个集合之间，可以有无数条分割超平面，使其将两个集合分离，但是如何定义与找出两个集合的“最优”分割超平面呢？

可以这样做：
找到集合“边界”上的若干点，以这些点为基础计算超平面的方向，以两个集合边界上的这些点的平均作为超平面的“截距”
因为超平面是通过这些点（向量）来支撑形成的，所以我们叫这些吃撑了超平面产生的向量叫做支持向量,support vector.

那么如果两个集合有部分相交，如何定义超平面，从而使得两个集合尽量分开呢？

如下图，在两个集合之间可以画出无数条超平面，到底哪条是最好的，到底哪些是支持向量呢？
image_1b1topoibt2839d5qjdo4rr1f.png-140.6kB

1.2 定义输入数据

假设给定一个特征空间上的训练集为：

image_1b1tp0330v6o1kune981ebn14a93g.png-6.3kB

其中， image_1b1tpatp911ct1li9t4e8vop513t.png-4.3kB

xi为第i个实例（样本），若n>1,则xi为向量。

yi为xi的标记：
当yi=1时，xi为正例
当yi=-1时，xi为负例
（至于为什么正负用（-1，1）表示呢？这个问题也许从来没有想过。其实这里没有太多原理，就是一个标记，你也可以用正2，负-3来标记。只是为了方便，yi/yj=yi*yj的过程中刚好可以相等，便于之后的计算。）

（xi,yi)称为样本点。

1.3 线性可分支持向量机

给定了上面提出的线性可分训练数据集，通过间隔最大化得到分离超平面为
image_1b1tporci1e53sa81lh9189lh0u9.png-3.3kB

相应的分类决策函数为：
image_1b1tppmtabnr1m1rnlj96kaskm.png-4.7kB

以上决策函数就称为线性可分支持向量机。

这里解释一下 image_1b1tq1o9fscb5jjdl7avfidq13.png-1.3kB 这个东东。
这是某个确定的特征空间转换函数，它的作用是将x映射到更高的维度。
比如我们看到的特征有2个：x1,x2,组成最见到的线性函数可以是w1x1,w2x2.但也许这两个特征并不能很好地描述数据，于是我们进行维度的转化，变成了w1x1+w2x2+w3x1x2+w4x1^2+w5x2^2.于是我们多了三个特征。而这个 image_1b1tq8f2ja1nb81m8vi591aiq1g.png-1.3kB 就是笼统地描述x的映射的。
最简单直接的就是： image_1b1tq9ortstg7ra1oedop81iae1t.png-2.3kB