一、概念
已知训练数据集 T={(x1,y1),(x2,y2),......,(xN,yN)}
分离超平面:y(x)=wx+b
(1)样本点(xi,yi)到分割超平面的函数间隔: r¯i=yi(wxi+b)
(2)数据集T到分割超平面的函数间隔:
(3)样本点(xi,yi)到分割超平面的几何间隔: r=yi(w||w||xi+b||w||)
(4)数据集T到分割超平面的几何间隔:
二、问题描述转化
我们求一个几何间隔最大的分离超平面:
即 max r 使得 yi(w||w||xi+b||w||)>=r=min ri
进一步化简得:
max r¯||w||
使得 yi(w||w||xi+b||w||)>=r¯||w||=minr¯i||w||
即
max r¯||w||
使得 yi(wxi+b)>=r¯=min r¯i
即
max 1||w||
使得 yi(wxi+b)>=1
即
max 1||w||
使得 yi(wxi+b)−1>=0
即
min 12||w||2
使得 yi(wxi+b)−1>=0
三、最后利用拉格朗日求解这个问题即可!