机器学习（五）：w·x+b模型（2）

最新推荐文章于 2024-01-17 00:07:28 发布

原创

最新推荐文章于 2024-01-17 00:07:28 发布 · 3.7k 阅读

1 ·

CC 4.0 BY-SA版权

本文深入探讨支持向量机（SVM），从训练集完全线性可分的情况出发，介绍了选择最大边距超平面的方法。接着讨论线性不可分情况下的损失函数和学习策略，包括合页损失函数和引入惩罚项。学习算法部分讲解了直接使用二次规划和对偶问题解决线性不可分问题，并解释了α的物理意义。此外，还详细阐述了核技巧，如高斯核函数，以及SVM与正则化逻辑回归的区别。

3. 支持向量机SVM

SVM主要用于分类问题， $w\in R^n, b\in R, y\in \{-1,1\}$ (注意此处不再将b视为 $w_0$ )

3.1 引言

3.1.1 training set完全线性可分

假设有很多wx+b=0超平面可以将training set中的数据正确分类，那么应该选用哪个（w,b）呢？如下图所示：
这里写图片描述
很容易凭借直觉选出wx+b=0与所有的数据点都比较远的超平面，由此我们可以选择这样的（w,b）:
使得 $\max_w margin(w)$ ，其中 $margin(w)=\min_{n=1..m} \frac 1{||w||} |w^Tx+b|$ ，这样做的一个问题是：假设(w’,b’)我们最终选择出来的参数值，那么(cw’,cb’)也满足条件（其中c为任意非零实数）。
为了解决这一问题，我们要求只在这样的(w,b)中选取： $\min_{n=1..m} |w^Tx+b|=1$
如果这样的话，问题就转化成：