svm的学习

最新推荐文章于 2022-11-30 09:56:32 发布

yezi_1026

最新推荐文章于 2022-11-30 09:56:32 发布

阅读量1.7k

点赞数

分类专栏：机器学习人工智能文章标签： svm 机器学习人工智能

本文链接：https://blog.youkuaiyun.com/yezi_1026/article/details/52743178

版权

本文详细介绍了支持向量机（SVM）的基本概念，包括间隔最大化、构建目标函数和选择分割超平面。通过讨论线性可分和非线性支持向量机，阐述了C（惩罚因子）的作用以及合页损失函数。此外，还讲解了核函数，特别是高斯核函数（RBF）在解决非线性问题中的应用。最后，简要总结了SVM的特点和不足，并提到了SMO算法用于优化求解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 概述

支持向量机（supportvector machine，svm）是一种被认为是效果最好的现成可用的分类算法之一。这个“现成”很重要，因为他在学术界和工业界都混得很好（而不同于有些算法，在抽象出来的模型里面很完美，但是在实际问题效果很差。）

2. 间隔（几何间隔）

对于上面第一个图，它们已经分的足够开，因此可以很容易在图中画出一条直线将2组数据分开，这组数据被称为线性可分数据。在2维空间，这个将数据集分开的是直线；在3维空间，将数据分开的是平面；在高维空间，将数据分开的是超平面，也就是分类决策面。

上面提供了3条直线，这3条直线都可以将数据分开。但是哪条直线更好呢？我们希望能用这种方式来构建分类器，即如果数据点离决策边界越远，那么其最后的预测结果越可信。这里定义点到分割面的距离为间隔。我们希望间隔尽可能的大，因为如果训练样本局部“扰动”或者在有限数据上训练分类器的话，我们希望分类器尽可能健壮，即超平面所受影响最小。换言之，这个划分的超平面所产生的分类结果是最鲁棒性的，对未见的例子泛化能力很强。我们怎么做呢？希望找到离分割超平面最近的点（这就是支持向量，support vector），确保它们离分割超平面尽可能的远。

3. what？ -->构建目标函数，找到分割平面，即确定w和b

首先论述线性可分支持向量机

1）.最大化几何间隔

先从最简单的点到直线的距离开始