支持向量机(support vector machine)
6.1 间隔与支持向量
给定训练样本,在样本空间中,划分超平面可通过如下线性方程描述:
,其中
为法向量,决定了超平面的方向;b为位移项,决定了超平面与原点之间的距离。
样本空间中任意点x到超平面(w,b)的距离可写为:
公式(1)
设超平面(w,b)能够将训练样本正确分类,即对于,若
,则有
;若
,则有
。令
公式(2)
支持向量(support vector)就是划分的超平面后离超平面最近的两个异类样例,形象上看,是这些样例支撑着这个超平面;
两个异类支持向量到超平面的距离之和为,这个值被称为间隔(margin)。
欲寻得最大间隔(maximum margin)的划分超平面,就是要找到能使公式(2)中的参数w,b,使得最大,即:
公式(3)
为了最大化间隔,仅需最大化,相当于最小化
,由此可将公式(3)重写为:
公式(4)
6.2 对偶问题
拉格朗日乘子
SMO算法
6.3 核函数
针对线性不可分问题,可将原始样本映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分。
令表示将x映射后的特征向量,于是,在特征空间中划分超平面所对应的模型可表示为:
公式(5)
6.4 软间隔与正则化
所有样本都必须划分正确的间隔称为硬间隔(hard margin),软间隔则是允许某些样本不满足约束。
6.5 支持向量回归