用人话讲明白支持向量机SVM（上）

最新推荐文章于 2025-10-09 01:34:11 发布

原创

最新推荐文章于 2025-10-09 01:34:11 发布 · 620 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #SVM

本文介绍了支持向量机（SVM）的基础知识，包括其作为机器学习模型的角色，以及线性分类器的概念。文章强调了SVM在解决二分类问题中的应用，并以直观的图形解释了线性分类器如何通过找到最大边界超平面来有效地分离两类样本。通过实例，解释了支持向量如何决定最佳分类器，指出SVM是基于距离最近的边界点（支持向量）来寻找最优超平面。

文章目录

1.什么是SVM

SVM支持向量机，号称机器学习的拦路虎。江湖传言，遇到了他，机器学习就会从入门到放弃。另一方面也就是说，只要搞定了SVM，后面的算法模型学起来都是小意思。

由于SVM较复杂，我分两篇来进行阐述，本篇仅介绍SVM的基本概念。

先看下官方定义：

支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷，以期获得最好的泛化能力。

VC 维，结构风险，有限样本，模型复杂性，最佳折衷，泛化能力，这一切……真是让人摸不着头脑……

行了，文绉绉的理论从来看不懂，我们还是从算法看起吧。

SVM一般用于解决二分类问题（也可以解决多分类和回归问题，本文暂不涉及），数学化语言概述如下：

样本数据：n个样本，p个输入 $x_{1},...,x_{p})$ ，1个输出y

第i个样本的输入： $X_{i}=(x_{i1},x_{i2},...,x_{ip})^{T}, i=1,2,...n$

输出y：一般用1和-1作为两类样本的标签

训练样本集D：
在这里插入图片描述
训练目的：以训练样本为研究对象，在样本的特征空间中找到一个超平面 $W^{T}X+b=0$ ，将两类样本（＋1和－1）有效分开，其中 $W=(w_{1},w_{2},...,w_{p})^{T}$

然而，这些个公式……更是看的云里雾里……

没关系，抽象的数学语言难以理解，我们就从直观的图形和例子开始，抽丝剥茧一点点学。

2.线性分类器的含义

上一篇学线性回归时，是从一元线性回归讲起。一元，即一个自变量，再加上一个因变量，这种数据形式在二维坐标轴中就可以表示成(x,y)。(x,y)的数据形式可以通过画点、画线在二维平面上进行展示，方便初学者理解。

学习算法时通过图的形式来入门，最合适不过。那么，我们讲SVM也从平面上的点和线讲起不就好了。

<

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。