吃瓜教程5——西瓜书第六章

文章介绍了支持向量机的基本原理,包括在n维空间中的超平面定义、几何间隔的概念以及模型如何寻找最大化几何间隔的超平面。重点讨论了为何选择拉格朗日对偶求解,以及其在处理线性可分和非线性分类问题中的优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一、算法原理

二、超平面

n维空间的超平面(,其中)

三、几何间隔

四、支持向量机

1.模型简介

2.问题:为什么支持向量机通常都采用拉格朗日对偶求解呢?


一、算法原理

从几何角度,对于线性可分数据集,支持向量机就是找距离正负样本都最远的超平面,相比于感知机,其解是唯一的,且不偏不倚,泛化性能更好。

二、超平面

n维空间的超平面(w^{T}x+b=0,其中w,x\in \mathbb{R}^{n}

  • 超平面方程不唯一
  • 法向量w和位移项b确定一个唯一超平面
  • 法向量w垂直于超平面(缩放w,6时,若缩放倍数为负数会改变法向量方向)
  • 法向量w指向的那一半空间为正空间,另一半为负空间
  • 任意点观到超平面的距离公式为
  • r=\frac{|w^{T}x+b|}{\left \| w \right \|}

三、几何间隔

对于给定的数据集X和超平面w^{T}x+b=0,定义数据集X中任意一个样本点\left ( x_{i},y_{i} \right ),y_{i}\in \left \{ -1,1 \right \},i =1,2,...,m关于超平面的几何间隔为

\gamma _{i}=\frac{y_{i}\left (\mathbf{w}^{T}x_{i}+b \right )}{\left \| w \right \|}

正确分类时:\gamma _{i}> 0,几何间隔此时等价于点到超平面的距离

没有正确分类时:\gamma _{i}< 0

对于给定的数据集X和超平面w^{T}x+b=0,定义数据集X关于超平面的几何间隔为:数据集X中所有样本点的几何间隔最小值

\gamma =\min\gamma _{i}(i=1,2,...m)

四、支持向量机

1.模型简介

给定线性可分数据集X,支持向量机模型希望求得数据集X关于超平面的几何间隔\gamma达到最大的那个超平面,然后套上一个sign函数实现分类功能
y=sign\left ( w^{T}x+b \right )=\left\{\begin{matrix} 1, &w^{T}x+b> 0 \\ -1,&w^{T}x+b< 0 \end{matrix}\right.
其本质和感知机一样,仍然是在求一个超平面。

注意:几何间隔最大的超开面就是“距离正负样本都最远的超平面”,理由如下:
当超平面没有正确划分正负样本时:几何间隔最小的为误分类点,因此\gamma<0
当超平面正确划分超平面时:\gamma≥0,且越靠近中央\gamma越大

2.问题:为什么支持向量机通常都采用拉格朗日对偶求解呢?

  • 无论主问题是何种优化问题,对偶问题恒为凸优化问题,因此更容易求解(尽管支持向量机的主问题本就是凸优化问题),而且原始问题的时间复杂度和特征维数呈正比(因为未知量是w),而对偶问题和数据量成正比因为未知量是α),当特征维数远高于数据量的时候拉格朗日对偶更高效;
  • 对偶问题能很自然地引入核函数,进而推广到非线性分类问题(最主要的原因)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值