【SVM】A Practical Guide to Support Vector Classication

本文介绍了支持向量机(SVM)的基本概念及其核技巧应用。涵盖了如何将数据映射到高维空间来处理线性不可分的问题,并讨论了离散特征的处理方式和数据规格化的重要性。此外,还提出了模型选择的建议,包括优先考虑RBF核的原因及在特征较多时采用线性核的策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

零、简介

  一般认为,SVM比神经网络要简单。

  优化目标:

  

  函数phi(x)会把训练样本x映射到高维(或无穷维)的空间中。

  基本的核:

  

 

一、实际运用

  一般流程:

  

 

二、数据处理

2.1 离散特征

  建议用m个数字表示某个离散特征的m个可取的值。m个数字中只有一个取1,其他的都取0。

  比如{红,黄,蓝}分别表示为(1,0,0), (0,1,0), (0,0,1)

2.2 规格化

  核的值通常与特征向量的内积有关。

  训练集和测试集必须用相同的规格化方法。

 

三、模型选择

3.1 优先选择RBF核

  1、它能把映射到高维空间,处理线性不可分的情况。

  2、超参数的数量影响计算的复杂度,多项式核比RBF核有更多的超参数

  3、。。。

  当特征很多时,一般就用线性核

3.2 cross-validation 和Grid-search

 

四、discussion

  有时,还必须使用特征选择features Selection等技术。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值