14、支持向量机:原理、优化与应用

支持向量机:原理、优化与应用

一、引言

在机器学习中,支持向量机(SVM)是一种非常实用的工具,用于在高维特征空间中学习线性预测器。高维特征空间会带来样本复杂度和计算复杂度的挑战。SVM算法通过寻找“大间隔”分隔器来应对样本复杂度挑战,即使特征空间维度很高甚至无穷,限制算法输出大间隔分隔器也能实现较小的样本复杂度。接下来,我们将深入探讨SVM的相关内容。

二、间隔与硬SVM
  1. 线性可分性与ERM假设
    • 设训练集 $S = (x_1, y_1), \ldots, (x_m, y_m)$,其中 $x_i \in R^d$ 且 $y_i \in {±1}$。若存在半空间 $(w, b)$ 使得 $y_i = sign(\langle w, x_i\rangle + b)$ 对所有 $i$ 成立,则称该训练集线性可分,此条件也可重写为 $\forall i \in [m], y_i(\langle w, x_i\rangle + b) > 0$。满足此条件的所有半空间 $(w, b)$ 都是ERM假设(其0 - 1误差为零,是可能的最小误差)。对于任何可分的训练样本,存在许多ERM半空间。
  2. 间隔的概念
    • 超平面相对于训练集的间隔定义为训练集中的点与超平面之间的最小距离。如果超平面具有大间隔,那么即使对每个实例进行轻微扰动,它仍能分隔训练集。半空间的真实误差可以用其在训练样本上的间隔来界定(间隔越大,误差越小),而与该半空间所在的欧几里得维度无关。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值