一、线性可分支持向量机
定义:给定线性可分训练数据集,通过间隔最大化或等价地求解相应的凸二次规划问题学习得到的分离超平面为:
以及相应的分类决策函数:
称为线性可分支持向量机。
SVM的分类决策函数和感知机决策函数形式很类似,但是求得的超平面不一样。
1. 函数间隔和几何间隔
函数间隔是人为定义的一个间隔度量,确定的点A到指定超平面的函数间隔不唯一;几何间隔是客观存在的一个间隔度量,确定的点A到指定超平面的几何间隔是唯一的,几何间隔的绝对值实际上就是点到超平面之间的距离,几何间隔的符号表明确定的点A是否被指定的超平面正确分类。
函数间隔定义:对于给定的训练数据集 T 和超平面
定义超平面 (w,b) 关于训练数据 T 的函数间隔为超平面
几何间隔定义:对于给定的训练数据集 T 和超平面
定义超平面 (w,b) 关于训练数据 T 的几何间隔为超平面
函数间隔和几何间隔关系: γi=γˆi∥w∥ , γ=γˆ∥w∥ 。
两种间隔都表示分类预测的正确性以及确信度。两种间隔若为正,表明分类正确,值越大,正确的确信度越大;若为负,表明分类错误,值越小,分错的程度越大。
2. 学习算法
支持向量机学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。对于线性可分的训练数据集,几何间隔最大的分离超平面是唯一的,这里的间隔最大化又称为硬间隔最大化。
间隔最大化的直观解释是:对训练数据集找到几何间隔最大的超平面意味着以充分大的确信度对训练数据进行分类。即不仅将正负实例点分开,而且对最难分的实例点也有足够大的确信度将它们分开,这样的超平面对未知的新实例也有很好的分类预测能力。
2.1 使用最大间隔构造约束最优化问题
SVM的学习即求出超平面的参数 w 和
上式中的目标函数的意义是求在几何间隔 γ 取到最大值时 w 和
利用函数间隔和几何间隔之间的关系可以直接将上面的最优化问题转化为:
函数间隔 γˆ 的取值并不影响最优化问题的解。上式的最优化问题是求几何间隔 γˆ∥w∥ 取最大值时 w 和