作者:禅与计算机程序设计艺术
1.简介
支持向量机(SVM)是机器学习中的一种分类模型。它是一种二类分类器,能够将输入空间的数据划分到任意数量的类别中,其间存在一个超平面,使得不同类别的数据点尽可能远离超平面,确保了类别的可分性。该算法由Vapnik在1995年提出,由于其优良的数学基础、快速求解速度、高度健壮性等优秀特性,目前仍然是机器学习领域中应用最广泛的分类模型之一。
支持向量机解决的问题实际上就是寻找合适的超平面将数据集分割成多个区域。不同的核函数可以选择,比如线性核函数、多项式核函数、径向基函数核函数等。核函数通过非线性变换将原始特征映射到高维空间,从而利用高维空间的数据结构来表示低维空间的数据。所以,如果对训练数据集进行很好的处理,则支持向量机可以非常有效地完成分类任务。
2.基本概念及术语介绍
2.1 定义及意义
支持向量机(support vector machine,SVM),是在二类分类问题中使用的分类模型,也称为二类支撑向量机(binary support vector machine)。其核心思想是找到一个高度“边界”的超平面来最大化分类间隔(margin),并允许一定的误差。
在二类情况下,假设输入空间X∈Rn和输出空间Y={-1,+1}k分别是输入和输出的空间,SVM要在输入空间中找到一个从属于两个子空间的一系列超曲面,使得不同类别的数据点尽可能远离超曲面的边缘,并且这些超曲面可以被分开。SVM是一种优化方法,它选择决策面或者说分类超平面以最大化距离支持向量(support vectors