SVM-核函数

最新推荐文章于 2025-10-21 17:06:36 发布

原创

最新推荐文章于 2025-10-21 17:06:36 发布 · 3.8k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#svm #核函数 #SMO #坐标上升法 #松弛变量

SVM在处理非线性数据时通过核函数将数据映射到高维空间，使得原本线性不可分的问题在高维空间变得可分。本文介绍了多项式和高斯核函数，以及如何使用坐标上升法的SMO算法解决SVM的对偶问题。同时，为处理outliers，引入了松弛变量δi，保证模型对异常值的鲁棒性。

1.1 SVM非线性可分-核函数
在上一章节中，我们首先假设数据在原始空间上是线性可分的，在这样的前提条件下，我们知道如何求解最大间隔分类器 $f(x)=w^Tx+b=\sum_{i=1}^m \alpha_i y^{(i)}<x^{(i)},x>+b$ 。但实际上，大多数情况下，数据可能并不是线性可分，你无法在原始数据空间上寻找到这样一条分类超平面，使得数据线性可分。

比如，下面这个例子，很明显蓝色点和红色点应该被归类为两个类别，数据本身又是线性不可分的。但是很容易想到，一个理想的分类界面应该是位于两类数据中心的“圆”而不是直线。（转自：http://blog.youkuaiyun.com/v_july_v/article/details/7624837）
这里写图片描述

那么尝试将这个假想的分界面用数学表达进行描述。如果以 $X,Y$ 表示二维空间的两个坐标，那么分界面圆的方程可以表示为，

a 1 X + a 2 X 2 + a 3 Y + a 4 Y 2 + a 5 X Y + a 6 = 0

$a_1X+a_2X^2+a_3Y+a_4Y^2+a_5XY+a_6=0$
有趣的是，我们可以通过构造另外一个五维度的空间，且其各个坐标值分别为，

Z1=X,Z2=X2,Z3=Y,Z4=Y2,Z5=XY $Z_1=X,Z_2=X^2,Z_3=Y,Z_4=Y^2,Z_5=XY$ ，那么上面的式子可以表达为，

\sum i = 1 5 a i Z i + a 6 = a 1 Z 1 + a 2 Z 2 + a 3 Z 3 + a 4 Z 4 + a 5 Z 5 + a 6 = 0

$\sum_{i=1}^5a_iZ_i+a_6=a_1Z_1+a_2Z_2+a_3Z_3+a_4Z_4+a_5Z_5+a_6=0$
显然在新构造的五维空间下，这个“圆”分界面变成线性的了！那么，可以考虑，如果将所有原始空间的数据通过映射关系:

∅:R2→R5 $\varnothing:R^2\rightarrow R^5$ ,从原始的二维空间映射为五维空间，数据将有可能变成线性可分的。

\emptyset (X, Y) = [X, X 2, Y, Y 2, X Y] T

$\varnothing(X,Y)=[X,X^2,Y,Y^2,XY]^T$

++++++
如果数据在变换后的高维空间（在上面的例子中是五维度）上是线性可分的，那么我们就可以在这个变换的空间上采用线性SVM计算最优间隔分类器对数据进行分类处理了。SVM在处理线性可分数据时分类器形式为，

f (x) = \sum i = 1 m α i y (i) < x (i), x > + b

$f(x)=\sum_{i=1}^m\alpha_i y^{(i)}<x^{(i)},x>+b$
假设映射关系

∅(x) $\varnothing(x)$ 可以将原始数据映射到特征空间F，且在该空间下，数据是线性可分的，那么在这个空间上的SVM分类器就表示为，

f (x) = \sum i = 1 m α i y (i) < \emptyset (x (i)), \emptyset (x) > + b

$f(x)=\$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。