支持向量机

最新推荐文章于 2025-05-03 08:38:15 发布

SuperBigFive

最新推荐文章于 2025-05-03 08:38:15 发布

阅读量73

点赞数

分类专栏：机器学习文章标签：支持向量机机器学习算法

本文链接：https://blog.youkuaiyun.com/CM_20030210/article/details/131050468

版权

机器学习专栏收录该内容

6 篇文章

订阅专栏

支持向量机是一种寻找最大边缘超平面的分类模型，其基础条件是所有样本点位于边缘超平面之外。通过拉格朗日乘子法处理约束优化问题，转换为对偶问题，利用SMO算法求解。支持向量是距离超平面最近的样本点，对模型的影响最大。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基础部分

基本思想：与感知机类似，同样是找超平面分隔两个类别，但支持向量机找的是最大边缘超平面。

在支持向量机构造的线性模型中，一个要满足的最基础的条件是：
$w^Tx_i + b \geq +1, y_i = + 1\\ w^Tx_i + b \leq -1, y_i = -1$
合并后有：
$y_i(w^Tx_i + b) \geq 1$
这个不等式的含义是，所有样本点都要满足位于边缘超平面以外。

点到超平面的距离 $\frac {|w^Tx + b|}{||w||}$ ，对于支持向量，其满足 $y_i(w^Tx_i + b) = 1$ ，即 $w^Tx_i + b| = 1$ ，而边缘超平面的距离取决于这些支持向量，故有边界距离 $\gamma = \frac {2}{||w||}$ 。

引入拉格朗日乘子

由于是最大边缘超平面，所以经过一定转化后有如下优化问题：
$\underset{w, b}{argmin} \frac {1}{2}||w||^2\\ s.t. \quad y_i(w^Tx_i + b) \geq 1, i = 1, 2, ..., n.$
不等式约束优化问题，利用 $KK T$ 条件，引入拉格朗日乘子 $\alpha_i \geq 0$ 得到拉格朗日函数：
$\alpha) = \frac {1}{2}||w||^2 - \sum_{i = 1}^{n}\alpha_i(y_i(w^Tx_i + b) - 1)$
需满足 $KK T$ 条件：
$\begin{aligned} &\alpha_i \geq 0;\\ &y_if(x_i) - 1 \geq 0;\\ &\alpha_i(y_if(x_i) - 1) = 0. \end{aligned}$
令 $\alpha)$ 对 $w$ 和 $b$ 的偏导为零可得：
$\sum_{i = 1}^{n}\alpha_iy_ix_i, \sum_{i = 1}^{n}\alpha_iy_i = 0$

将原问题转化成其对偶问题

将上式带回到拉格朗日函数中，可消去 $w$ 和 $b$ 并得到对偶优化问题：
$\quad L(\alpha) = \sum_{i = 1}^{n}\alpha_i - \frac{1}{2}\sum_{i = 1}^{n}\sum_{j = 1}^{n}\alpha_i\alpha_jy_iy_jx_i^Tx_j\\ s.t. \quad \sum_{i = 1}^{n}\alpha_iy_i = 0,\\ \alpha_i \geq 0, i = 1, 2, ... , n.$
最小化原优化问题 $\alpha)$ ，即等价于最大化对偶问题 $L(\alpha)$ ，解出 $\alpha$ 后即可利用 $\sum_{i = 1}^n\alpha_iy_ix_i$ 解得 $w$ ；对于所有 $\alpha_i > 0$ 对应的支持向量 $x_i$ ，由于其满足 $y_i(w^Tx_i + b) = 1$ ，求出 $b$ 后取均值作为参数 $b$ 的最终取值。

序列最小化算法（SMO）求解上述对偶问题 $L(\alpha)$

选取一对需更新的变量 $\alpha_i$ 和 $\alpha_j$ ；
固定 $\alpha_i$ 和 $\alpha_j $ 以外的参数，带入求解对偶优化问题获得更新后的 $\alpha_i$ 和 $\alpha_j$ 。

由对偶优化问题的约束条件，当 $\alpha_i$ 和 $\alpha_j$ 固定时，实际上 $\alpha_j$ 可以用 $\alpha_i$ 加一常数来表示，带入 $L(\alpha)$ 后则是一个只关于变量 $\alpha_i$ 的二次规划问题，很容易求解。但是要主要满足 $\alpha_i \geq 0, i = 1, 2, ... , n$ ，并且先前 $KK T$ 条件也必须满足。