15、支持向量机（SVM）：原理、应用与优化

最新推荐文章于 2025-11-30 12:58:23 发布

github5actions

最新推荐文章于 2025-11-30 12:58:23 发布

阅读量5

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习实战精要文章标签： SVM 支持向量机线性分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/github5actions/article/details/154856481

机器学习实战精要专栏收录该内容

74 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

支持向量机（SVM）：原理、应用与优化

1. 支持向量机简介

支持向量机（SVM）是一种强大且通用的机器学习模型，能够执行线性或非线性分类、回归，甚至异常值检测。它是机器学习中最受欢迎的模型之一，对于复杂的中小型数据集的分类任务，SVM 尤为适用。

2. 线性 SVM 分类

2.1 大间隔分类原理

SVM 的基本思想可以通过图形来解释。以鸢尾花数据集为例，两个类别可以用一条直线轻松分开（线性可分）。不同的线性分类器有不同的决策边界，其中一些决策边界可能会使分类效果不佳，而 SVM 分类器的决策边界不仅能分开两个类别，还能尽可能远离最近的训练实例，就像在两个类别之间拟合了一条最宽的“街道”，这就是大间隔分类。

决策边界完全由位于“街道”边缘的实例决定，这些实例被称为支持向量。添加“街道”外的训练实例不会影响决策边界。

2.2 特征缩放的敏感性

SVM 对特征缩放很敏感。如果特征的尺度差异较大，可能会导致决策边界不理想。通过特征缩放（如使用 Scikit - Learn 的 StandardScaler），可以改善决策边界的效果。

2.3 软间隔分类

硬间隔分类要求所有实例都必须在“街道”外且在正确的一侧，但它存在两个主要问题：一是只适用于线性可分的数据；二是对异常值敏感。

为避免这些问题，可以使用软间隔分类，其目标是在保持“街道”尽可能宽和限制间隔违规（即出现在“街道”中间甚至错误一侧的实例）之间找到良好的平衡。

在使用 Scikit - Learn 创建 SVM 模型时，可以指定超参数 C。C 值较低时，模

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。