day6 SVM支持向量机

最新推荐文章于 2025-04-24 21:59:08 发布

舌耳

最新推荐文章于 2025-04-24 21:59:08 发布

阅读量578

点赞数 1

分类专栏：机器学习文章标签：支持向量机

本文链接：https://blog.youkuaiyun.com/weixin_38280090/article/details/95031508

版权

机器学习专栏收录该内容

8 篇文章

订阅专栏

文章目录

6.1什么是支持向量机

一个二分类模型，寻找决策边界最宽的一个超平面将数据进行分割
解决问题的步骤：
*把所有样本和其对应的分类标记交给算法进行训练
*如果发现线性可分，那么直接找出超平面
*如果发现线性不可分，那么先进行映射到高维（接近无限高）再找超平面事实上并没有映射只是将其计算结果映射到相应维度（因为得出的值是相同的）
*最后得到的超平面就是分类函数的表达式

在这里插入图片描述
显然第二个比第一个好一些

6.2 推导过程

6.2.1距离和目标函数

在这里插入图片描述
距离
有这样一个平面，如何求点X到该平面的距离呢？

求点到平面的距离，只要求点到点在方向量上的映射即可
设平面 $w^{T}X+b=0$ 上有点X’ X’’ 可以求出向量
$\vec{{X'X''}}=(X''-X')$
$w^{T}X' = -b,w^{T}X'' = -b$
则可以求出平面法向量 $W^{T}$
$\left(w^{T}(x''-x') \right)=0$
距离表达式如下：
$d=\left|\frac {w^{T}}{|w|}(X-X') \right|=\frac {1}{|w|}|w^{T}x+b|$
目标
有这样的数据集：(X1,Y1)(X2,Y2)… (Xn,Yn)
Y为样本类别：
当X为正时 Y=+1
当Y为负时 Y=-1
决策方程为 $y_(x)=w^{T}\Phi(x_i)+b$

$y_{(x_i)>0} <=>y_{i}=+1$
$y_{(x_i)<0} <=>y_{i}=-1$
推出 $y_{i}*y_(x_i)>0$
优化目标
通俗的讲：找到一个条件（w和b），使得离该平面最近的点最远
点到直线的距离简化为:
$\frac{y_{i}*(w^{T}\Phi(x_i)+b)}{||W||}$
则目标为
$max\lbrace\frac{1}{||W||}min\lbrace{y_{i}*(w^{T}\Phi(x_i)+b)}\rbrace\rbrace$
将 $y_{(i)}*y_{(x_i)}>0$ 放缩变换得到：
$y_{(i)}*y_{(x_i)}≥1$
$y_{i}*(w^{T}\Phi(x_i)+b)≥1$
那么 $y_{i}*(w^{T}\Phi(x_i)+b)$ 的最小值为1
只需要考虑
$max\frac{1}{||W||}$
约束条件
$y_{i}*(w^{T}\Phi(x_i)+b)≥1$
然后将求极大值问题转化为求极小值问题
$min_{w,b}\frac{1}{2}w^2$
然后使用拉格朗日乘子法求解

6.2.2使用拉格朗日乘子法解SVM

先转化

带约束的优化问题：
$min_{x} f_{0}(x)$
约束为
$f_i(x)≤0,i=1,...m$
$h_i(x)≤0,i=1,...q$
原式转化为：
$L_{(x,λ,v)}=f_{(x)}+\sum_{i=1}^{m}λ_{i}f_{i}(x)+\sum_{i=1}^{q}v_{i}h_{i}(x)$
套下这个式子那么咱们的式子为：
$L(w,b,a)=\frac{1}{2}||w||^2-\sum_{i=1}^{n}α_i(y_i(w^T*Φ_{(x_i)+b})-1)$
约束条件 $y_{i}*(w^{T}\Phi(x_i)+b)≥1$

SVM求解

分别对w和b求偏导，分别得到两个条件（基于对偶性质）
$min_{w,b}max_{a}L_{(w,b,a)}=max_{a}min_{w,b}L_{(w,b,a)}$
对w求偏导:
$\frac{δL}{δW}=0 => w=\sum_{i=1}^{n}α_iy_iΦ_{(x_n)}$
对b求偏导:\frac{δL}{δW}=0 =>0=\sum_{i=1}^{n}α_iy_i $KaTeX parse error: Can't use function '$' in math mode at position 9: 带入原始公式:$̲L(w,b,a)=\frac{…$ \frac{1}{2}*w^{T}*w-wT\sum_{i=1}^{{n}α_iy_iΦ_{(x_i)}-b\sum_{i=1}}{n}α_iy_i+\sum_{i=1}^{n}α_i $KaTeX parse error: Can't use function '$' in math mode at position 2: $̲=\sum_{i=1}{n}α…$ min_α \frac{1}{2}\sum_{i=1}^{{n}\sum_{j=1}}{n}α_iα_jy_iy_jΦ_(x_i)Φ_(y_i)-\sum_{i=1}^{n}Φ_i$$
条件：
$\sum_{i=1}^{n}α_iy_i=0$
$α_i≥0$