支持向量机（SVM）凸二次规划的求解——序列最小最优化算法（SMO）原理及python实现

最新推荐文章于 2025-04-19 14:57:22 发布

xjtu_rzc

最新推荐文章于 2025-04-19 14:57:22 发布

阅读量1.1w

点赞数 4

文章标签：机器学习 python svm smo算法

本文链接：https://blog.youkuaiyun.com/qq_39320588/article/details/104117596

版权

本文详细介绍了支持向量机（SVM）的序列最小最优化（SMO）算法，包括两个变量的二次规划求解、变量选择方法以及阈值b与差值Ei的计算。SMO通过解决两个变量的子问题逐步逼近最优解，文中还给出了Python实现的概述。最终，训练出的SVM模型精度达到98%。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原问题：
$\min_\alpha\frac{1}{2}\sum_{i=1}^N\sum_{j=1}^N\alpha_i\alpha_jy_iy_jK(x_i,x_j)-\sum_{i=1}^N\alpha_i$
s.t.
$\sum_{i=1}^N\alpha_iy_i=0$
$0\leqslant\alpha_i\leqslant C, i=1,2,\cdots,N$
SMO算法的基本思想是：
如果所有变量的解都满足最优化问题的KKT条件，那么这个最优化问题的解就得到了。否则，选择两个变量，固定其他变量，针对这两个变量构建一个二次规划问题。
这样做的目的是，通过求解两个变量的二次规划问题，能不断靠近原有凸二次规划问题的解，并且计算方法有解析方法。
子问题有两个变量，其中一个为违反KKT条件最严重的那一个，另一个由约束条件自动确定。由与约束条件的存在，子问题实际上只有一个自由变量。
整个SMO算法包含两个部分：求解两个变量二次规划的解析方法和选择变量的启发式算法。

两个变量的二次规划求解方法

假设 $\alpha_1, \alpha_2$ 为变量，其余的量为固定量
设问题的原始可行解为 $\alpha_1^{old}, \alpha_2^{old}$ ,最优解为 $\alpha_1^{new},\alpha_2^{new}$ ，并且在沿着约束方向未经剪辑时 $\alpha_2$ 的最优解为 $\alpha_2^{new,unc}$
由于约束条件存在，因此 $\alpha_2^{new}$ 的取值范围为：
$L\leqslant\alpha_2^{new}\leqslant H$
其中 $L$ 与 $H$ 是 $\alpha_2^{new}$ 所在的对角线段端点的界。
如果 $y_1\not=y_2$ ，则
$L=\max(0,\alpha_2^{old}-\alpha_1^{old}),\,\,\,\,\,H=\min(C,C+\alpha_2^{old}-\alpha_1^{old})$
如果 $y_1=y_2$ ，则
$L=\max(0,\alpha_2^{old}+\alpha_1^{old}-C),\,\,\,\,\,H=\min(C,\alpha_2^{old}+\alpha_1^{old})$

最低0.47元/天解锁文章