支持向量机数学证明与推导（SVM）

AndrewHR

于 2018-07-30 10:12:05 发布

阅读量3.9k

点赞数 5

CC 4.0 BY-SA版权

分类专栏：数据挖掘、推荐、广告文章标签： svm原理线性可分支持向量机线性支持向量机支持向量机对偶算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gangyin5071/article/details/81280338

本文详细介绍了支持向量机（SVM），包括线性可分支持向量机的硬间隔最大化，线性可分与线性支持向量机的对偶算法，以及软间隔最大化和核技巧的概念。通过对SVM的学习，我们可以解决非线性分类问题，并优化模型的分类效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

支持向量机（SVM）

@(数据挖掘)[svm]

支持向量机（SVM）

一、线性可分支持向量机和硬间隔最大化

名词解释

线性可分：就是指给定一组数据集 $T = \left \{(x_1, y_1), (x_2,y_2), \cdots,(x_N,y_N) \right \}$ ，其中， $x_i \in \chi =R^n, y_i \in \gamma = \left \{+1,-1 \right \}, i =1,2,\cdots,N$ ，如果存在某个超平面S， $w \cdot x + b = 0$ ，能够将整个数据集的正实例和负实例完全正确地划分到超平面的两侧，则称这个数据集T是线性可分数据集（linearly separable data set）；否则就是线性不可分的。
硬间隔最大化，也就是线性可分支持向量机，在线性可分数据集上利用间隔最大化求最优分离超平面的过程
首先从点到直线的距离发散到高维易知， $\left | w\cdot x + b \right |$ 能够相对的表示点 $x$ 到超平面的距离，而 $w \cdot x + b$ 的符号与类标记 $y$ 的符号是否一致能够表示分类是否正确，所以：

$\hat{γ_{i}} = y_{i} (w \cdot x + b)$ $\hat{\gamma_i} = y_i(w \cdot x +b)$
可以用来表示数据集中每个点分类正确性和到分割超平面距离（也可以称为分类置信度大小），也叫超平面 $(w,b)$ 关于样本点 $(x_i,y_i)$ 的函数间隔。
我们可以进一步定义超平面关于整个数据集T的函数间隔为数据集T中所有点到超平面函数间隔的最小值：

$γ ̂ = min i = 1, \dots, N γ i^$ $\hat{\gamma} = \min \limits_{i=1,\cdots,N}{ \hat{\gamma_i}}$
但是可以发现，我们同时按比例增大 $w$ 和 $b$ ，超平面仍然是 $w \cdot x +b$ 没有变，但是函数间隔却同样按比例变化了，所以我们对分离超平面的法向量 $w$ 加了约束，使得 $\left \| w \right \|=1$ ，也就是间隔值不会改变，这时函数间隔变成了几何间隔，记做：
$γ i = y i (w ‖ w ‖ \cdot x + b ‖ w ‖)$ $\gamma_i = y_i(\frac{w}{\left \| w \right \|} \cdot x + \frac{b}{\left \| w \right \|} )$
则同理数据集到超平面的几何距离为：
$γ = min i = 1, \dots, N γ i$ $\gamma = \min \limits_{i=1,\cdots,N}{{ \gamma_i}}$
进一步，我们的线性可分支持向量机就变成了一个约束最优化问题：
$max w, b γ$ $\max \limits_{w,b}{\gamma}$
$s . t . y i (w ‖ w ‖ \cdot x + b ‖ w ‖) ⩾ γ, i = 1, 2, \dots, N$ $s.t. \quad y_i(\frac{w}{\left \| w \right \|} \cdot x + \frac{b}{\left \| w \right \|} ) \geqslant \gamma, \quad i =1,2,\cdots,N$
即是最大化几何间隔的问题，接着根据函数间隔与几何间隔的关系，我们易得：
$max w, b γ ̂ ‖ w ‖$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。