sklearn.svm.OneClassSVM用户手册（中文）

最新推荐文章于 2025-03-20 09:55:48 发布

翻译最新推荐文章于 2025-03-20 09:55:48 发布 · 8.9k 阅读

CC 4.0 BY-SA版权

原文链接：https://scikit-learn.org/stable/modules/generated/sklearn.svm.OneClassSVM.html?highlight=svm#sklearn.svm.OneClassSVM

机器学习相关专栏收录该内容

11 篇文章

订阅专栏

OneClassSVM是一种无监督的异常值检测算法，基于libsvm实现，用于估计高维分布的支持。本文详细介绍OneClassSVM的参数配置，包括kernel、gamma、nu等，以及其属性和方法，如decision_function、fit、predict等。

class sklearn.svm.OneClassSVM(kernel='rbf', degree=3, gamma='scale', coef0=0.0, tol=0.001, nu=0.5, shrinking=True, cache_size=200, verbose=False, max_iter=-1)

无监督异常值检测。
估计高维分布的支持。
该实现基于libsvm。
在用户手册里面可以了解更多关于异常检测的知识。

参数（kernel,gamma,nu和tol比较重要）

kernel： string, optional (default=’rbf’)，
核函数，字符串型，可选择的，默认为’rbf’，即高斯核
指定算法中要使用的内核类型。它必须是“linear”，“poly”，“ rbf”，“ sigmoid”，“precomputed”或可调用项之一。如果没有给出，将使用“ rbf”。如果给出了可调用对象，则将其用于预先计算内核矩阵。

degree: int, optional (default=3)
阶数，整形，可选择的。
多项式内核函数（“ poly”）的阶数。被所有其他内核忽略

gamma：{‘scale’, ‘auto’} or float, optional (default=’scale’)
内核系数，{‘scale’, ‘auto’}或者浮点型，可选择的，默认为’scale’
“ rbf”，“ poly”和“ Sigmoid”的内核系数。
如果传递了gamma =‘scale’（默认值），则它将1 /（n_features * X.var（））用作gamma值，
如果为‘auto’，则使用1 / n_features。
在版本0.22中进行了更改：gamma的默认值从‘auto’更改为’scale’。

coef0：float, optional (default=0.0)
内和参数，浮点型，可选择的，默认为0.0
内核函数中的独立参数。它仅对“ poly”和“ sigmoid”有意义。

tol：float, optional
停止标准的度量

nu：float, optional
训练误差分数的上限，支持向量分数的下限。应该在间隔（0，1]中。默认情况下，取0.5。

shrinking：boolean, optional
布尔值，可选的
是否使用缩小的启发式方法。

cache_size：float, optional
指定内核缓存的大小（以MB为单位）。

verbose：bool, default: False
启用详细输出。请注意，此设置利用了libsvm中每个进程的运行时设置，如果启用了该设置，则该设置可能无法在多线程上下文中正常工作。

max_iter：int, optional (default=-1)
对求解器内的迭代进行硬性限制，或者为-1（无限制）。

属性

support_：列向量(n_SV)
支持向量的索引

support_vectors_：矩阵(n_SV, n_features)
支持向量

dual_coef_：行向量，shape = [1, n_SV]
分配给特征的权重（原始问题的系数）。仅在线性内核的情况下可用。
coef_是从dual_coef_和support_vectors_派生的只读属性

intercept_：行向量，shape = [1,]
决策函数中的常数。

offset_：浮点型
偏移量用于根据原始分数定义决策函数。我们具有以下关系：Decision_function = score_samples-offset_。该偏移量与intercept_相反，并且为与其他异常值检测算法保持一致而提供。

fit_status_：整型
如果正确安装，则为0，否则为1（将发出警告）

例子

from sklearn.svm import OneClassSVM
X = [[0], [0.44], [0.45], [0.46], [1]]
clf = OneClassSVM(gamma='auto').fit(X)
clf.predict(X)
##array([-1,  1,  1,  1, -1])
clf.score_samples(X)  # doctest: +ELLIPSIS
##array([1.7798..., 2.0547..., 2.0556..., 2.0561..., 1.7332...])