机器学习-支持向量机

最新推荐文章于 2022-11-13 20:59:04 发布

原创最新推荐文章于 2022-11-13 20:59:04 发布 · 445 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #支持向量机 #核函数

机器学习专栏收录该内容

30 篇文章

订阅专栏

支持向量机的代价函数

$J(\theta) = \min_{\theta} C\sum_{i=1}^m[y^{(i)}cost_1(\theta^Tx^{(i)}) + (1-y^{(i)})cost_0(\theta^Tx^{(i)})] + \frac{1}{2}\sum_{i=1}^n\theta_j^{2}$

C 可以看作 $\frac{1}{\lambda}$

支持向量机的作用

人们有时将支持向量机看作是大间距分类器
支持向量机能够努力的将正样本和负样本用最大的间距分开。这也是支持向量机具有鲁棒性的原因，鲁棒是Robust的音译，也就是健壮和强壮的意思。
支持向量机（SVM）实际上是一种凸优化问题，因此它总是能找到全局最小值或者接近它的值从而不用担心局部最优

关于内积和范数

1. 内积：设有n维向量

令，

则称[x,y]为向量x与y的内积。

2. 范数：称为向量x的范数(或长度)。

支持向量机产生大间距分类的原因

由内积和范数引起变化，具体先不写。。。

核函数

公式

$exp(-\frac{||x-l^{(i)}||^2}{2\sigma^2})$

目的

使用核函数构造复杂的非线性分类器，能够根据数据的相似与否定义许多新的特征值

相似度函数就是核函数就是高斯核函数， $\sigma$ 是高斯核函数的参数

我们通过标记点和核函数来定义新的特征变量从而训练复杂的非线性边界

如何使用

我们通过核函数能够得到

如何选取标记点

每一个标记点的位置都与样本点的位置精确对应，选出 $m$ 个标记点。这样就说明特征函数基本上是在描述每一个样本距离样本集中其他样本的距离

支持向量机如何通过核函数有效的学习复杂非线性函数

如果我们要进行预测，首先我们需要计算特征向量 $f_{(m+1)×1}$ ，内部值都是传入 $x$ 与标记点通过核函数与m个样本点进行相似度比较产出的。

我们再使用参数转置乘特征向量： $\theta^Tf = \theta_0f_0 + \theta_1f_1 + \theta_2f_2 + ……+ \theta_mf_m$

如果结果大于等于零，预测结果为 1。

但是我们怎么获得参数 $\theta$ 的值，我们通过最小化下式就能得到支持向量机的参数
$J(\theta) = \min_{\theta} C\sum_{i=1}^m[y^{(i)}cost_1(\theta^Tf^{(i)}) + (1-y^{(i)})cost_0(\theta^Tf^{(i)})] + \frac{1}{2}\sum_{i=1}^n\theta_j^{2}$

这里的 $n = m$ ，这里我们仍然不对 $\theta_0$ 做正则化处理

最后的 $\sum_{i=1}^n\theta_j^{2}$ 还能够被写为 $\theta^T\theta$ 或是别的比如 $\theta^TM\theta$ ，这取决于我们使用的是什么核函数，这能够使支持向量机更有效率的运行，这样修改能够适应超大的训练集，那时求解m维参数的成本会非常高，主要为了计算效率。

核函数虽然也能用在逻辑回归上，但是它毕竟是为支持向量机开发的，用在逻辑回归上会十分缓慢。