SVM简介

最新推荐文章于 2025-06-02 21:54:17 发布

u014088761

最新推荐文章于 2025-06-02 21:54:17 发布

阅读量604

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： svm

本文链接：https://blog.youkuaiyun.com/u014088761/article/details/80145553

机器学习专栏收录该内容

4 篇文章

订阅专栏

本文主要是对SVM进行一个简单介绍。注：作者也是初学者，如有错误，请不吝赐教。

参考了中科院的汪海燕、黎建辉、杨风雷等人的支持向量机理论及算法研究综述这篇论文，在此表示感谢。

1、什么是SVM

SVM维基百科介绍链接

维基百科对SVM的定义：更正式地来说，支持向量机在高维或无限维空间中构造超平面或超平面集合，其可以用于分类、回归或其他任务。直观来说，分类边界距离最近的训练数据点越远越好，因为这样可以缩小分类器的泛化误差。
尽管原始问题可能是在有限维空间中陈述的，但用于区分的集合在该空间中往往线性不可分。为此，有人提出将原有限维空间映射到维数高得多的空间中，在该空间中进行分离可能会更容易。为了保持计算负荷合理，人们选择适合该问题的核函数 k(x,y) 来定义SVM方案使用的映射，以确保用原始空间中的变量可以很容易计算点积。高维空间中的超平面定义为与该空间中的某向量的点积是常数的点的集合。定义超平面的向量可以选择在数据基中出现的特征向量 $x_{i}$ 的图像的参数 $\alpha_i$ 的线性组合。通过选择超平面，被映射到超平面上的特征空间中的点集x 由以下关系定义： $\textstyle \sum _{i}\alpha _{i}k(x_{i},x)=\mathrm {constant} .$ 注意，如果随着y 逐渐远离 $x$ ， $k(x,y)$ 变小，则求和中的每一项都是在衡量测试点 x 与对应的数据基点 $x_{i}$ 的接近程度。这样，上述内核的总和可以用于衡量每个测试点相对于待分离的集合中的数据点的相对接近度。

SVM(Support Vector Machine):中文名为支持向量机，是建立在严格的统计学习理论上的一种监督式的学习算法。就个人理解而言，SVM算法就是一种以实现最优划分，即实现训练集和分类超平面间隔最大为目标的一种算法，对于线性平面不可分的数据集，它的主要实现方式是通过核函数将数据集映射到一个高维的可线性划分的数据空间中再进行划分。由于支持向量机具有较强的理论基础(理论部分的具体推导详见我的下一篇博客或者是pluskid的SVM的系列博客)，故而它能保证找到的极值解是全局最优解而非局部最小值，这也就决定了SVM 方法对未知样本有较好的泛化能力，正因为这些优点，SVM 能良好地应用到模式识别、概率密度函数估计、时间序列预测、回归估计等领域，也被广泛应用到模式识别中的手写数字识别、文本分类、图像分类与识别等众多领域中。但是，就我的理解而言，虽然SVM也有在回归方面的应用，但是SVM主要是运用在分类任务上。