这是一篇简单的学习总结,并无分享意义。参考资料有周志华老师的《机器学习》,七月在线冯老师的课,还有pluskid大牛的博客。
间隔可以用法向量w的模表示,间隔最大化等于
这个凸二次规划问题的极小值可以通过其对偶问题的最大值解出。用拉格朗日乘子法得到对偶问题,拉格朗日函数对w求偏导使其为零得到
最终得到模型,发现一个新的样本加入后,求新样本跟支持向量的点积就可以求出label。
如果样本非线性可分,那么就需要映射到一个更高维的空间使其线性可分。设映射为ϕ,类似地,我们需要计算ϕ(xi)Tϕ(xj),但是直接计算ϕ(xi)Tϕ(xj)计算量太大。实际上我们不需要知道ϕ的具体表达式,我们只需要知道ϕ(xi)Tϕ(xj)的结果就行了。所以我们定义了一个核函数,表示两个映射之后的样本的点积。核函数有现成的表达式可选。核方法可用到其他将线性学习器拓展为非线性学习器。
本文总结了支持向量机(SVM)的学习要点,包括间隔最大化的数学推导过程,通过拉格朗日乘子法求解对偶问题,以及如何利用核函数处理非线性可分数据。介绍了从线性可分情况到非线性情况的处理方法。
241

被折叠的 条评论
为什么被折叠?



