机器学习面试必知：SVM中解决泛化问题

最新推荐文章于 2025-05-12 16:13:13 发布

Neekity

最新推荐文章于 2025-05-12 16:13:13 发布

阅读量3.9k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：机器学习面试统计学习文章标签： SVM 软间隔

本文链接：https://blog.youkuaiyun.com/Neekity/article/details/87990536

在前面SVM一文中，我们解得的支持向量机在原始空间中是对训练数据能精确划分的如下图所示。可想而知，有大概率会出现过拟合的问题。这样的支持向量机的泛化能力较差。
在这里插入图片描述因此我们需要一种方式修改支持向量机，允许一些训练数据点被误分类，从而获得一个更好的泛化能力。我们允许数据点在边缘边界的错误侧，同时增加一个惩罚项，这个惩罚项随着与决策边界的距离的增大而增大。我们令这个惩罚项是距离的线性函数，为了实现它我们引入了松弛变量 $\xi_{n}\geq0$ ，这样每个训练数据点都有一个松弛变量。对于位于正确的边缘边界内部的点或者边缘上的点 $\xi_{n}=0$ 。对于其他的点， $\xi_{n}=|t_{n}-y(x_{n})|$ 。因此对于位于决策边界 $y(x_{n})=0$ 上的点， $\xi_{n}=1$ ,并且 $\xi_{n}>1$ 就是被误分类的点，所以被精确分类的点满足 $t_{n}y(x_{n})\geq 1-\xi_{n},\quad n=1,...,N$