15、支持向量机(SVM)深入解析

支持向量机(SVM)深入解析

1. 相似特征与高斯径向基函数(RBF)核

在处理数据时,我们可能会思考如何选择地标。一种简单的方法是在数据集中每个实例的位置创建一个地标。这样做会增加维度,提高转换后的训练集线性可分的可能性。但缺点是,一个包含 m 个实例和 n 个特征的训练集,会被转换为包含 m 个实例和 m 个特征的训练集(假设去掉原始特征)。如果训练集非常大,最终会得到同样多的特征。

高斯 RBF 核与多项式特征方法类似,相似特征方法对任何机器学习算法都可能有用,但计算所有额外特征可能会很耗费计算资源,尤其是在大型训练集上。不过,核技巧再次发挥了 SVM 的魔力:它可以在不实际添加许多相似特征的情况下,获得与添加这些特征相似的结果。以下是使用 SVC 类尝试高斯 RBF 核的代码:

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

rbf_kernel_svm_clf = Pipeline([
        ("scaler", StandardScaler()),
        ("svm_clf", SVC(kernel="rbf", gamma=5, C=0.001))
    ])
rbf_kernel_svm_clf.fit(X, y)

超参数 gamma (γ)和 C 的不同值会训练出不同的模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值