AI:支持向量机(SVM)

支持向量机(SVM)理论基础详解:从零开始的完全指南

一、SVM的核心思想:直观理解

1.1 什么是分类问题?

想象你在玩一个游戏:桌上有红色和蓝色的球,你需要画一条线把它们分开。这条线就是分类边界。SVM的目标是找到一条最优分界线,使得这条线到最近的红色球和蓝色球的距离(间隔)最大。

在这里插入图片描述

  1. 二维坐标系中红色点和绿色三角形分别代表两类样本
  2. 黑色实线为最优分类超平面(决策边界)
  3. 两条虚线表示分类间隔边界(间隔带)
  4. 被圆圈标注的样本点为支持向量
  5. 箭头标注间隔距离(Margin Width)

1.2 关键术语解释

  • 超平面:在N维空间中的N-1维分界平面(二维是直线,三维是平面)
  • 间隔(Margin):分界线到最近数据点的距离
  • 支持向量:离分界线最近的样本点(图中红色和蓝色的边缘点)

类比理解
把SVM想象成建一座最宽的"隔离带",支持向量就是隔离带边缘的"护栏",决定了隔离带的宽度和位置。


二、数学原理:从几何到优化

2.1 几何间隔:如何衡量分类质量?

对于任意数据点 ( x i , y i ) (x_i, y_i) (xi,yi) y i = ± 1 y_i=±1 yi=±1 表示类别),到超平面 w T x + b = 0 w^Tx + b = 0 wTx+b=0 的距离公式为:
几何间隔 = ∣ w T x i + b ∣ ∥ w ∥ \text{几何间隔} = \frac{|w^Tx_i + b|}{\|w\|} 几何间隔=wwTxi+b

为什么重要?
几何间隔越大,分类的置信度越高。SVM的目标是最大化所有样本的最小几何间隔。

2.2 线性可分SVM的优化问题

将最大化间隔转化为数学优化问题:
max ⁡ w , b min ⁡ i y i ( w T x i + b ) ∥ w ∥ s.t. y i ( w T x i + b ) ≥ 1 ( ∀ i ) \begin{aligned} \max_{w,b} & \quad \min_i \frac{y_i(w^Tx_i + b)}{\|w\|} \\ \text{s.t.} & \quad y_i(w^Tx_i + b) \geq 1 \quad (\forall i) \end{aligned} w,bmaxs.t.iminwyi(wTxi+b)yi(wTxi+b)1(i)

等价转换
通过缩放技巧,简化为更易求解的凸二次规划问题:
min ⁡ w , b 1 2 ∥ w ∥ 2 s.t. y i ( w T x i + b ) ≥ 1 ( ∀ i ) \begin{aligned} \min_{w,b} & \quad \frac{1}{2}\|w\|^2 \\ \text{s.t.} & \quad y_i(w^Tx_i + b) \geq 1 \quad (\forall i) \end{aligned} w,bmins.t.21w2yi

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Thomas Kant

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值