SVM4—核方法

最新推荐文章于 2025-01-02 14:49:38 发布

weixin_43484614

最新推荐文章于 2025-01-02 14:49:38 发布

阅读量755

点赞数 23

文章标签：支持向量机机器学习人工智能

本文链接：https://blog.youkuaiyun.com/weixin_43484614/article/details/104698875

版权

核方法

$\bullet$ 前面我们用超平面（线性模型）来分开不同类型的训练箱体
$\bullet$ 但在实际任务中，原始样本空间也许不存在一个超平面能将训练样本分开，例如：在这里插入图片描述
$\bullet$ 对这类问题，我们可以将原始空间映射到一个更高维的空间，使得在这个特征空间数据线性可分
$\bullet$ 令 $\phi(\mathbf x)$ 表示将 $\mathbf x$ 映射后的特征向量，则在特征空间划分超平面对应的模型可表示为： $f(\mathbf x) = \mathbf w^T\phi(\mathbf x) + b$
$\bullet$ 根据之前SVM的推导，得到特征映射后的SVM目标函数为： $min_{w,b} = \frac{1}{2}||\mathbf w||_{2}^2 + C\sum_{i=1}^{N}\xi_{i}$ $\space\space y_{i}(\mathbf w^T \phi(\mathbf x) + b) >= 1 - \xi_i，i=1,...,N$ $\xi_{i} > 0, i = 1,...,N$

核方法—对偶

$\bullet$ 相应的对偶问题为：
$max_{\alpha}\sum_{i=1}^{N}\alpha_{i} - \frac{1}{2}\sum_{i=1}^{N}\sum_{j=1}^{N}\alpha_{i}\alpha_{j}y_{i}y_{j}<\phi(\mathbf x_{i}),\phi(\mathbf x_{i})>$ $\space\space 0 <= \alpha_{i} <= C, i = 1,...,N$ $\sum_{i=1}^{N}\alpha_{i}y_{i} = 0$
$\bullet$ 求得对偶问题的解 $\alpha$ 后，可计算 $\mathbf w，b$ ，从而得到分类判别函数： $f(\mathbf x) = \mathbf W^T\phi(\mathbf x) + b$ $=\sum_{i=1}^{N}\alpha_{i}y_{i}<\phi(\mathbf x_{i}), \phi(\mathbf x)> + b$

核技巧

$\bullet$ 将问题变为对偶问题：只需计算点积
　　１)在SVM中，最大化下列目标函数
在这里插入图片描述
　　2）判别函数为：
$\bullet$ 由于特征空间维数可能很高（甚至无穷维），直接计算特征空间的点积通常是困难的
$\bullet$ 核函数：高维空间中的点积可写成核(kernel)的形式 $K(\mathbf x_{i}, \mathbf x_{j}) = <\phi(\mathbf x_i), \phi(\mathbf x_j)>$ 老师说到点积的时候，说也就是相似度，那么应如何理解呢？
$\bullet$ 选定核函数，无需计算映射 $\phi(\mathbf x)$ 就可以计算点积
　　１）SVM核化目标函数为在这里插入图片描述　　2）预测模型为没有+b这一项吗

构造核函数

$\bullet$ 一种核函数的构造方式是显示地定义一个特征映射 $\phi(.)$ ，将每个输入x映射到 $\phi(\mathbf x)$ ，从而得到核函数的间接定义 $k(\mathbf x, \mathbf x') = \phi(\mathbf x)^T\phi(\mathbf x')$ 其中的 $\phi(\mathbf x)$ 称为基函数。相对于直接求点积，这种方式好像也不能节省开销吧，因为最终还是要求点积。
$\bullet$ 显示定义特征映射的情况下，核函数为特征空间（可能为无限维）中的内积。
$\bullet$ 另一种可选方式是直接定义核函数，此时需保证核函数是有效核。令x为输入空间，k(.,.)是定义在x*x上的对称函数，则k是核函数的充要条件是对已任意数据 $D = \{x_{1},...,x_{N}\}$ ，则核矩阵K总是半正定的。正定、半正定的准确定义？在这里插入图片描述对于一个半正定核矩阵，总是能找到一个与之对应的 $\phi$ 。任何一个核函数都隐式定义了一个再生Hibert空间。
可以通过找到 $\phi$ ，找到K，也可以直接找到K，这样必然会有一个 $\phi$ 存在，但再回去找已经没意义了，因为最终需要的就是K。