第七章支持向量机

yuezi223

于 2024-12-26 11:12:56 发布

阅读量781

点赞数 21

分类专栏：李航-统计学习方法随记文章标签：支持向量机算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_46345703/article/details/144738054

版权

七、支持向量机

支持向量机（Support vector machines，SVM）
- 模型：定义特征空间上最大的线性分类器，区别于感知机模型，具备核技巧，所以也是非线性分类器
  - 包括：线性可分支持向量机、线性支持向量机、非线性支持向量机
- 策略：间隔最大化，形式化为求解凸二次规划问题，等价正则化合页损失函数最小化问题
  - 线性可分、线性支持、非线性支持向量机分别通过硬间隔最大化，软间隔最大化，核技巧及软间隔最大化来学习
- 算法：求解凸二次规划最优化算法
核函数：将输入从输入空间映射到特征空间得到的特征向量之间的内积，进而帮助我们学习非线性支持向量机，隐式地从高维特征中学习线性支持向量机。

7.1 线性可分支持向量机

7.1.1 线性可分SVM模型

给出训练数据集：

符号说明： $x_i$ 表示第i个特征向量实例， $y_i$ 是类标记，取值为+1和-1，表示正例和负例。
对于该模型，我们假设训练数据集线性可分（见定义2.2）
训练目标：在特征空间中找到分离超平面，让实例分到不同的类，并通过间隔最大化求得最优分离超平面（区别于感知机，此时超平面是唯一的）

二类分类问题的示意图如下，下一小节，我们介绍如何度量点到平面的间隔，进而为后续的间隔最大化策略做铺垫。

7.1.2 函数间隔与几何间隔

通过点距离平面超平面的远近来表示分类预测的确信程度
- 如上图所示，对于距分离超平面较远的A点，我们预测该点为正类则更加确信，对于较近的C点，则认为该点预测为正类则不那么确信
函数间隔：对于 $w \cdot x + b = 0$ 超平面， $∣ w \cdot x + b ∣$ 则表示点x距离超平面的远近，通过其符号与类标记y是否一致来表示分类是否正确
- 考虑到平面系数变为原来的k倍后，超平面不变，函数间隔变为k倍，因此我们可以加入规范化约束 $\|w\|=1$ 使得函数间隔固定

几何间隔：相对函数间隔，几何间隔则对应几何意义上真实的距离，距离为 $\gamma_i=y_i\left(\frac{w}{\|w\|}\bullet x_i+\frac{b}{\|w\|}\right)$
- 从图7.2中看到，点A（正例）到超平面的几何间隔为 $\gamma_i=\frac w{\|w\|}\bullet x_i+\frac b{\|w\|}$
- 那么负例点到超平面的几何间隔为 $\gamma_i=-\left(\frac{w}{\|w\|}\bullet x_i+\frac{b}{\|w\|}\right)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。