通过看台湾大学林轩田老师机器学习课程,把svm理解过程梳理下来
主要是四步:1,svm介绍 2,svm对偶问题解法 3,svm核函数 4,svm的soft软分类
svm介绍
现在介绍的资料都是线性可分的,svm可以理解为线性的二元分类问题,线性分类的线如何划分使模型更加强壮,而且能容忍更多噪声,就是svm要解决的问题。
要寻找这样的直线:在众多直线中,每个划分方法都会有资料点到直线的最小值,在最小值中寻找一个最大值,就是我们要寻找的直接,即最终目标!
现在已经把问题转化为求解上面的公式!
x变量到超平面的距离可以借助x',x''这两个变量求解
x-x' 向量在w法向量上的投影,就是x到超平面的距离:
现在完全转化为数学问题:可以对上面的数学问题进行优化,进而求解
优化使yn(wTxn+ b) =1 这样不影响求解过,大概理解是如果yn(wT xn + b) >1, 就违背了1/||w||求最大值,可能会有更大的
最终,确定了通俗svm的公式,可以用QP二次规划方法求解,也可以用SMO算法,机器学习实战这本书中介绍了:
完结,这就是通俗地介绍了下svm,没有用正规公式。