线性可分:
一个训练集线性可分是指:对于,
,使
,若
,则
;若
,则
。
超平面:
如图1所示,给定训练样本集,其中
分类方法最基本的想法就是基于训练集D在样本空间找到一个划分超平面,将不同类别的样本分开。
图1 超平面
在样本空间中,划分超平面可通过如下线性方程来描述:
其中,为法向量,决定了超平面的方向;b为位移项,决定了超平面与原点之间的距离。样本空间任意点x到超平面
的距离可写为:
支持向量:
若超平面能将训练样本正确分类,则总存在缩放变换
和
使下式成立:
如图2所示,距离超平面最近的这几个训练样本使上式成立,它们被称为“支持向量”(support vector),两个异类支持向量到超平面的距离之和为
图2 支持向量与间隔
支持向量机的优化:
最大化,即最小化:
,限制条件:
。
SVM处理非线性问题:
最小化,
为正则项,限制条件为
。