支持向量机（SVM）的推导_支持向量机推导-优快云博客

本文链接：https://blog.youkuaiyun.com/AI_dataloads/article/details/133279313

一、什么是支持向量机（svm）

支持向量机（Support Vector Machine, SVM）是一种常用的监督学习算法，主要用于二分类问题，但也可以扩展到多分类问题。它可以通过在特征空间中找到一个最优的超平面来进行分类，同时最大化超平面与最近的数据点之间的间隔。

现在这里有这么一堆点：我们要想办法用一条线把它们分隔开，使线的一边是蓝色点，另一边是绿色点，线该怎么划呢？

我们可以这样随意的画出几条这样的线来：

但是，这些线看起来都离点的距离太近了，划分的效果不是很明显，例如：如果我们现在增加这样一个绿点，它就会被划分到线的另一边去，被视为蓝点一类了，可是根据我们的直观感受，这个新增的绿点应该属于下面这一大群绿点一类。

所以我们现在需要想象画出这样一条线：它能将两类数据正确划分并且间隔最大

于是我们就得到了这个：

其中超平面方程为：

标签问题：在SVM中我们不用0和1来区分，使用+1和-1来区分，这样会更严格。假设超平面可以将训练的样本正确分类，那么对于任意样本:如果y=+1,则称为正例，y= -1,则称为负例。

现在我们就要确定一个函数可以将任意点进行划分：

整合一下我们可以得到：

点到面的距离公式是：

拓展一下，我们就可以得到点到超平面的距离：

如何找到最优的超平面呢？

超平面可视化：

求解带有约束条件的极值可使用拉格朗日乘子法：

现在我们再来考虑线性不可分的情况：

常用的核函数有以下几个：

关于高斯核函数中γ值的分析：

总的来说，SVM 是一个强大的机器学习算法，特别适用于高维、小样本、非线性分类问题。然而，在应用时需要考虑计算复杂性、参数调优和数据规模等因素，并根据具体情况选择是否使用 SVM。