学习笔记：机器学习之支持向量机(四、线性支持向量机-软间隔最大化对偶形式)

最新推荐文章于 2024-09-23 22:58:08 发布

萌龙如我们

最新推荐文章于 2024-09-23 22:58:08 发布

阅读量353

点赞数 1

分类专栏：机器学习文章标签：机器学习支持向量机学习

本文链接：https://blog.youkuaiyun.com/qq_44635691/article/details/126346929

版权

机器学习专栏收录该内容

15 篇文章

订阅专栏

活动地址：优快云21天学习挑战赛

1 对偶问题(肢解)

原始问题为：
$\min_{w,b,\xi_i}\frac{1}{2}||w||^2+C\sum^N_{i=1}\xi_i \\ s.t. \quad 1-\xi_i-y_i(w\cdot x_i+b)\le0 \\ \xi_i\ge0,i=1,2,...,N$

其对偶问题就是拉格朗日函数的对 $w,b,\xi$ 的极小再对 $\alpha，\mu$ 的极大值问题。
广义拉格朗日函数：
$L(w,b,\xi,\alpha,\mu )=\frac{1}{2}||w||^2+C \sum_{i=1}^N \xi_i+\sum^N_{i=1}\alpha_i(1-\xi_i-y_i(w\cdot x_i+b))-\sum_{i=1}^N\mu_i\xi_i$
求偏导得：
$\nabla_wL(w,b,\xi,\alpha,\mu)=w-\sum_{i=1}^N\alpha_iy_ix_i =0 \\\nabla_bL(w,b,\xi,\alpha,\mu)=-\sum_{i=1}^N\alpha_iy_i=0\\\nabla_{\xi_i}L(w,b,\xi,\alpha,\mu)=C-\alpha_i-\mu_i=0$
解得：
$\left\{ \begin{aligned} w & = \sum_{i=1}^N\alpha_iy_ix_i\\ \sum_{i=1}^N\alpha_iy_i & = 0 \\ C-\alpha_i-\mu_i & = 0 \end{aligned} \right.$
带入 $L(w,b,\xi_i,\alpha_i,\mu_i )$ 得：
$L(w,b,\xi_i,\alpha,\mu )=-\frac{1}{2}\sum^N_{i=1}\sum^N_{j=1}\alpha_i\alpha_ju_iy_j(x_i\cdot x_j)+\sum^N_{i=1}\alpha_i$
接下来原本求上式得极大值，式子整体加负号，则转化为求其极小值，即
$\min\limits_{\alpha}\frac{1}{2}\sum^N_{i=1}\sum^N_{j=1}\alpha_i\alpha_ju_iy_j(x_i\cdot x_j)-\sum^N_{i=1}\alpha$
得到目标函数后，再梳理一下约束条件。
首先，有求偏导解出来的 $\sum_{i=1}^N\alpha_iy_i=0$
其次，拉格朗日乘数大于等于0，即 $\mu,\alpha\ge0$ ,在求偏导时得到 $C-\alpha_i-\mu_i = 0$
最后，综合一下得到： $\le \alpha_i \le C$

2 对偶问题(整合)

理清楚对偶问题的来龙去脉就可以重新梳理整合一下支持向量机——软间隔最大化得对偶问题。
输入:数据集 $T=\{(x_i,y_i),(x_2,y_2),...,(x_N,y_N)\},其中，x_I\in R^n,y_i\in\{-1,1\},i=1,2,...,N.$
输出： 分离超平面和分类决策函数
(1)构造凸二次规划问题
$\min\limits_{\alpha}\frac{1}{2}\sum^N_{i=1}\sum^N_{j=1}\alpha_i\alpha_ju_iy_j(x_i\cdot x_j)-\sum^N_{i=1}\alpha \\ s.t.\quad\sum_{i=1}^N\alpha_iy_i=0\\ 0 \le \alpha_i \le C\\$
求出最优解 $\alpha*$
(2)求w,b
有了 $\alpha^*$ 可计算出 $\sum_{i=1}^N\alpha^*y_ix_i$ ;

求b需要借助KTT条件：

再从以上条件中得出 $b^*$ 。
若 $\alpha_*=0,w^*=0$ ，超平面不存在，则 $\alpha_* \ 0，0<\alpha_i^*<C$ ,就找到了 $\alpha_i^*$ 的上界。最终找的点在超平面边界上，则满足 $y_j(w^*\cdot x_j+b^*)=1$
经过整理后： $b^*=y_j-w^*\cdot x_j$