【支持向量机SVM】常见面试题

支持向量机(SVM)是一种有监督的二分类算法,通过寻找最大化间隔的分割超平面进行分类。当样本线性不可分时,引入软间隔和核函数以解决非线性问题。SMO算法用于求解SVM对偶问题。SVM的优点包括全局最优解、解决非线性和高维问题,但可能在大数据集和核函数选择上存在问题。防止过拟合的方法包括增加数据量、特征降维和使用松弛向量。SVM广泛应用于文本分类和图像识别等场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

什么是SVM

SVM也叫支持向量机,是一种有监督的二分类算法,主要通过在特征空间内寻找一个最大化和两个类别之间间隔的分割超平面。

它主要有三种分割策略:

  1. 当训练样本为线性可分时,通过硬间隔最大化学习线性分类器进行处理,即线性可分SVM
  2. 当训练样本为近似线性可分时,可以引入松弛向量,通过软间隔最大化来学习线性分类器,即线性SVM
  3. 当旋转样本为线性不可分时,可将低维数据映射到高维空间中,再通过核函数和软间隔最大化学习非线性SVM

为什么使用软间隔/为什么引入松弛向量

我们在解决样本的分类问题时,通常设定样本是线性可分的,即在特征空间中总是存在一个存在平面可以使样本线性可分,而在实际的任务中很难保证样本是线性可分的,因为数据中通常存在噪声,一味追求线性可分的模型会导致过拟合。为了防止过拟合,我们要降低对样本数据的质量要求,即允许少量的样本分类错误,而不是像硬间隔这样不允许任何的错误存在。

在这样的考虑之下,我们就引入了松弛向量\xi_{i}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值