SVM拓展和SVR支持向量回归

最新推荐文章于 2025-06-16 16:24:27 发布

奇而思

最新推荐文章于 2025-06-16 16:24:27 发布

阅读量3.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： SVM SVR 支持向量回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/zhao_cq/article/details/80981259

本文介绍了SVM在面对非线性可分情况时引入的软间隔概念，以及如何通过调整优化目标来处理错误分类样本。接着详细讲述了SVM的对偶形式和KKT条件，最后探讨了支持向量回归（SVR），包括L1和L2损失函数在回归中的应用，并解释了SVR中支持向量的选择原则。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

软间隔

在建立SVM模型时，假定正负样本是线性可分的。但是，实际有些时候，样本不是完全线性可分的，会出现交错的情况，例如下图。

这时，如果采用以下模型

$min_{w,b}\{\dfrac{1}{2}\|w\|_2^2\},\\ subject\ to\quad y_i(w^Tx_i+b)\ge1$

可能就没有可行解。针对这种情况，允许某些样本不满足约束 $y_i(w^Tx_i+b)\ge 1$ , 但是在最大化间隔的同时，不满足约束的样本应尽可能少，优化目标可以写为：

$min_{w,b}\dfrac{1}{2}\|w\|^2+C\sum_{i=1}^{m}l_{0/1}(y_i(w^Tx_i+b)-1)\quad \tag{4-1}$

其中 $l_{0/1}$ 是0/1损失函数，

L 0 / 1 (z) = {10 if z<0 otherwise

$L_{0/1}(z)= \begin{cases} 1 &\mbox{if z<0}\\ 0 &\mbox{otherwise} \end{cases}$
从(4-1)可以看到，当C为无穷大时，所有样本必须满足约束

yi(wTxi+b)≥1yi(wTxi+b)≥1 $y_i(w^Tx_i+b)\ge 1$ 才可行。当C取有限值时，允许一些样本不满足约束。

$l_{0/1}$ 非凸非连续，数学性质不好，因此常用其他函数替代，称为替代损失函数（surrogate loss function）。一些常用的替代损失函数有：

hinge损失： $l_{hinge}(z)=max(0,1-z)$

指数损失exponential loss： $l_{exp}(z)=exp(-z)$

对率损失 logistic loss: $l_{log}(z)=log(1+exp(-z))$

如果采用hinge损失，则（4-1）变为：

$min_{w,b}\dfrac{1}{2}\|w\|^2+C\sum_{i=1}^{m}max(0,1-y_i(w^Tx_i+b))\quad \tag{4-2}$

引入松弛变量 $\xi_i$ (也叫容忍度)，C为参数，需要根据经验调整。可以得到

m i n w, b s u b j e c t t o {1 2 ∥ w ∥ 22 + C \sum i = 1 N ξ i}, y i (w T x i + b) \geq 1 - ξ i; i = 1, . . ., N ξ i \geq 0 (4) (5) (6) (4-3)

$\begin{align} min_{w,b}&\{\dfrac{1}{2}\|w\|_2^2+C\sum_{i=1}^N\xi_i\},\\ subject\ to\quad &y_i(w^Tx_i+b)\ge1-\xi_i;i=1,...,N\\ &\xi_i \ge 0 \end{align}\tag{4-3}$
这个是一个QP问题。

可以看到，当 $\xi_i=0$ 时， $y_i(w^Tx_i+b) \ge 1$ ，样本点被正确分类，且距离大于支撑向量。

当 $1 \ge \xi_i \gt 0$ 时， $y_i(w^Tx_i+b) \ge 0$ 即，样本点被正确分类，但是距离有可能小于支撑向量yi(w

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。