《机器学习》周志华(西瓜书)学习笔记第六章支持向量机

最新推荐文章于 2025-02-18 23:37:34 发布

Sundm@lhq

最新推荐文章于 2025-02-18 23:37:34 发布

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习西瓜书学习笔记文章标签：机器学习周志华学习笔记支持向量机第六章

本文链接：https://blog.youkuaiyun.com/sdm12345/article/details/90613270

机器学习周志华学习笔记

总目录

The more fluent you become in math,the more unstoppable you will be in anying you want to do in life

第六章支持向量机

6.1 间隔与支持向量

给定训练样本集 $D=\{(x_1,y_1),(x_2,y_2),\cdots,(x_m,y_m)\}$ , $y_i \epsilon\{-1,+1\}$

分类学习的最基本思想就是：基于训练集D在样本空间中找到一个划分超平面，将不同类别的样本分开

在样本空间中，划分超平面可以通过以下线性方程表示：
$w^Tx+b=0$
其中

$w=(w_1,w_2,\cdots,w_d)$ 为法向量，决定了超平面的方向；
b为位移项，决定了超平面与原点之间的距离。

显然，划分超平面可被法向量 $w$ 和 $b$ 确定，下面我们将其记为 $(w, b)$

样本空间任意衣点 $x$ 到超平面 $\bm{(w,x)}$ 的距离可写为：
$\gamma=\frac{|w^Tx+b|}{||w||}$

假设超平面 $\bm{(w,b)}$ 能将训练样本正确分类，即对于 $(x_i,y_i)\epsilon D$ ,若 $y_i=+1$ ，则有
$\bm{\omega^Tx_i} + b \gt 0$ ,若 $y_i=-1$ ，则有 $\bm{\omega^Tx_i} + b \lt 0$ .
令
$\omega^Tx_i+b \geq +1,y_i=+1$
$\omega ^Tx_i+b \leq-1,y_i=-1$
距离超平面最近的这几个训练样本点使上式等号成立，他们被称为“支持向量”，两个异类支持向量到超平面的距离之和为"间隔"(margin)：
$\gamma=\frac{2}{||\omega||}$
在这里插入图片描述
欲找到具有“最大间隔”（maximum margin）的划分超平面，即：
$\max_{w,b}{\frac{2}{||\omega||}}$

$\ y_i(\omega^Tx_i+b)\geq1,i=1,2,\cdots,m$

显然，为了最大化间隔，仅需最大化 $||\omega||^{-1}$ ,这等价于最小化 $||\omega||^2$ ,于是，上式可重写为：
$\min_{w,b}{\frac{1}{2}}{||\omega||^2}$
$s.t.\ y_i(\omega^Tx_i+b)\geq1,i=1,2,\cdots,m$
这就是支持向量机(Support Vector Machine)的基本型