【sklearn第十讲】支持向量机之回归篇

最新推荐文章于 2025-05-14 21:59:05 发布

原创

最新推荐文章于 2025-05-14 21:59:05 发布 · 2.7w 阅读

49 ·

CC 4.0 BY-SA版权

文章标签：

#python

本文介绍了支持向量机（SVM）在回归问题中的应用，包括线性SVR、非线性SVR（如NuSVC和SVR），以及它们的数学原理和核函数选择。支持向量回归利用支持向量的概念，构建只依赖部分训练数据的模型，以提高泛化能力。此外，还提到了SVM在异常检测中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习训练营——机器学习爱好者的自由交流空间（入群联系qq：2279055353）

回归

支持向量分类的方法能被推广到解决回归问题，称为支持向量回归。由支持向量分类产生的模型仅依赖训练数据的子集，因为创建模型的代价函数并不考虑超过边界的训练点。类似地，由支持向量回归产生的模型仅依赖训练数据的子集，因为创建模型的代价函数忽略任何接近模型预测的训练数据。支持向量回归有三个不同的执行版本：SVR, NuSVR, LinearSVR. LinearSVR执行速度比SVR要快，但只提供线性核。fit方法取X, y作为输入参数，这里，y取浮点值而不是分类的整数值。

from sklearn import svm
X = [[0, 0], [2, 2]]
y = [0.5, 2.5]
clf = svm.SVR()
clf.fit(X, y)

这里写图片描述

clf.predict([[1, 1]])

这里写图片描述

异常检测

One-class SVM可以被用于异常检测(novelty detection), 即，给定一个样本集，检测该集的灵活边界，以便将新的数据点归类是否属于这个集合。类OneClassSVM执行之。这是一个典型的无监督学习，所以fit方法只有一个数组X作为输入，并没有类标签。
这里写图片描述

核函数

可以使用以下的核函数：

linear: $< x, x^{'} >$
polynomial: $(γ<x,x′>+r)d(\gamma<x, x'>+r)^d$ , $d$ 由参数degree, $r$ 由coef0指定
rbf: $exp⁡(−γ∥x−x′∥2)\exp(-\gamma\|x-x'\|^2)$ , $γ\gamma$ 由参数gamma指定，且必须是正的
sigmoid: $tanh⁡(γ<x,x′>+r)\tanh(\gamma<x, x'>+r)$ , $r$ 由参数coef0指定

数学原理

数学上，一个支持向量机在一个高维或有限维空间构造了一个或一组超平面，这些超平面被用作分类、回归或其它任务。本质上，由超平面实现的最优分割，即是这个超平面到任何类的最近的训练数据点的距离是最大的。通常来说，边界越大，分类器的泛化误差(generalization error)就越低。

这里写图片描述

SVC

给定训练向量

最低0.47元/天解锁文章

200万优质内容无限畅学