目录
SVM是一种无监督机器学习方法,常用于二分类问题。其相较于逻辑回归,引入了核函数的概念,对非线性关系有更好的分类效果;同时由于对偶问题的引入,使得计算的复杂性由维度的大小转变为样本的数量,避免了维度爆炸。但是由于SVM的本质是二次规划问题,样本数量大的时候,需要占用大量的存储空间和时间,不容易实现;同时SVM解决多分类问题存在一定困难。
一、硬间隔SVM(Hard Margin SVM)
硬间隔SVM是一个二次凸规划问题,其形式为:
其推导过程为:
(1)列出原始目标函数和约束条件。
目标函数:使间隔最大(间隔指离分隔线最近点到分隔线的距离)
约束条件:分隔线两侧的所有点均属于同一类别
即:
其中,间隔(最小距离)的推导过程如下:
(2)表达式化简
目标函数中,由于w与x无关,所以可以将1/||w||提出来;
由第一步得到的约束条件可知,必定存在一个γ>0,使得所有样本到分隔线的距离>γ,即:
这样,可以将目标函数中的min后所有元素进行替换,即:
(3)最终形式
目标函数:将max化为min,转化为二次型
约束条件:由于最小距离等于1,所以所有样本的距离大于等于1