机器学习：支持向量机（SVM）

最新推荐文章于 2025-03-27 22:09:08 发布

南柯Sdream

最新推荐文章于 2025-03-27 22:09:08 发布

阅读量1.3k

点赞数 9

文章标签：支持向量机机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_63698246/article/details/135070977

版权

一、算法介绍

支持向量机（Support Vector Machine，SVM）是一种常用的监督学习算法，用于分类和回归任务。SVM的基本原理是构建一个最优超平面来分割不同类别的数据点。

在二分类问题中，SVM试图找到一个能够将两个类别的数据点尽可能分开的超平面。超平面是一个d-1维的线性子空间，其中d是数据的特征维度。SVM的目标是找到具有最大间隔（即离超平面最近的样本点的距离最大）的超平面。

SVM的核心思想是将数据映射到高维特征空间中，通过引入核函数可以避免直接计算高维特征空间的复杂性。常用的核函数有线性核、多项式核和高斯核等。这些核函数能够将数据从原始空间映射到一个更高维度的空间，使得原本线性不可分的数据在新的空间中变得线性可分。

SVM的训练过程可以形式化为一个凸优化问题，通过最小化目标函数来确定超平面的位置和宽度。目标函数通常由数据的误分类损失和正则化项组成，正则化项是为了防止过拟合。

一旦训练完成，SVM可以用于对新样本进行分类或回归预测。对于分类问题，新样本将被映射到特征空间中，并根据其位置与超平面的关系来判断其所属类别。对于回归问题，SVM可以通过拟合一个边界带来预测。

SVM具有一些重要的特性，包括结构化风险最小化、稀疏性和鲁棒性等。它在处理小样本、高维数据和非线性问题方面表现出色，并在许多领域中得到广泛应用，如图像分类、文本分类、生物信息学和金融预测等。

二、基于最大间隔分隔数据

2.1 线性模型

在二维空间上，两类点被一条直线完全分开叫做线性可分。如下图，在二维坐标下，样本空间中找到直线, 将不同类别的样本分开。

上述将数据集分隔开来的直线称为分隔超平面，即 $w^{t}x+b=0$

2.2 超平面
由于数据点都在二维平面上，所以此时分隔超平面就只是一条直线。但是，如果所给的数据集是三维的，那么此时用来分隔数据的就是一个平面。显而易见，更高维的情况可以依此类推。如果数据集是1000维的，那么就需要一个999维的某某对象来对数据进行分隔。当数据集是N维时，需要一个N-1维的某某对象来对数据进行分隔。N-1维的该对象被称为超平面（hyperplane），也就是分类的决策边界。分布在超平面一侧的所有数据都属于某个类别，而分布在另一侧的所有数据则属于另一个类别。

从二维扩展到多维空间中时，将 D0和 D1 完全正确地划分开的 $w^{t}x+b=0$ 就成了一个超平面。为了使这个超平面更具鲁棒性，我们会去找最佳超平面，以最大间隔把两类样本分开的超平面，也称之为最大间隔超平面。

如上图，有五条直线，它们都能将数据分隔开，但是其中哪一条最好呢？我们希望找到离分隔超平面最近的点，确保它们离分隔面的距离尽可能远。这里点到分隔面的距离被称为间隔（margin）。我们需要的是间隔尽可能地大，这是因为如果犯错或者在有限数据上训练分类器的话，分类器尽可能健壮。所以，应选择”正中间”的那条直线 , 容忍性好, 鲁棒性高, 泛化能力最强，选择最大化决策边界的边缘。

2.3 支持向量

如下图，支持向量（support vector）就是离分隔超平面最近的那些点。

超平面方程： $w^{t}x+b=0$

2.4 支持向量机
支持向量机（Support Vector Machines, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器&

最低0.47元/天解锁文章

博客等级

码龄4年

8
原创

33
点赞

42
收藏

22
粉丝

关注

私信

热门文章

最新评论

机器学习环境搭建
优快云-Ada助手: 恭喜您开始博客创作！标题《机器学习环境搭建》听起来非常有趣，对于想要入门机器学习的读者来说，这是一个很好的起点。在这篇博客中，您可以分享一些关于搭建机器学习环境的经验和技巧，这对于那些想要开始学习机器学习的人们来说将会非常有帮助。接下来，我建议您可以考虑介绍一些常用的机器学习工具和框架，并分享一些实践案例，这样读者们可以更好地理解和应用所学知识。希望您在接下来的创作中继续保持谦虚的态度，让读者们感受到您的用心与热情。期待您的下一篇博客！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
KNN算法对糖尿病数据分类
机智小常: 请问可以发一下源码吗，谢谢！
机器学习：支持向量机（SVM）
优快云-Ada助手: 恭喜你写了这么一篇精彩的博客！机器学习领域的知识对很多人来说都是一种挑战，但你用简洁清晰的语言把SVM算法讲得很透彻。希望你能继续分享更多关于机器学习的知识，也许可以考虑深度学习或者神经网络的主题，这些都是当前热门的研究方向。加油！
机器学习：朴素贝叶斯
优快云-Ada助手: 恭喜你写了这么精彩的博客！对朴素贝叶斯算法的介绍让我受益匪浅。希望你能继续分享你的机器学习见解，也许下一篇可以介绍一下其他常用的分类算法，比如决策树或支持向量机等。期待你的下一篇作品！
机器学习基于Python绘制PR曲线和ROC曲线
优快云-Ada助手: 恭喜您写了第三篇博客！标题看起来很有吸引力，我对PR曲线和ROC曲线在机器学习中的应用非常感兴趣。您的博客内容一定非常有深度和实用价值。希望您能继续保持创作的热情，分享更多有关Python和机器学习的知识。如果可以的话，我期待您能探讨一下如何在实际项目中优化PR曲线和ROC曲线的应用，或是介绍一些应对实际挑战的技巧。谢谢您的辛勤付出，期待您的下一篇博客！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。