机器学习_支持向量机

本文介绍了支持向量机(SVM)的基本原理,包括在高维空间中的超平面划分、支持向量的角色、间隔最大化以及核技巧的应用。通过代码示例展示了如何使用SVM进行分类,并讨论了其在处理高维数据和小样本集上的优势,以及在大规模数据、缺失数据和噪声处理方面的挑战。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.4 支持向量机

1.4.1 算法原理

将数据映射到一个高维空间中,在空间中找到一个最优的超平面来分隔不同类别的数据,使得不同类别的数据点被分到不同的区域。SVM通过训练样本点构建一个划分超平面,并且在所有可能的划分超平面中找到一个能够最大化间隔的超平面,称之为最优超平面。

1.4.1.1 超平面

在二维空间中,超平面是一条直线,而在更高维的情况下,它成为一个超平面。SVM的目标是找到一个最佳的超平面,使得不同类别的数据点能够在超平面的两侧分开。这个超平面被称为“分隔超平面”。

1.4.1.2 支持向量

分隔超平面的两侧都有一些最接近超平面的数据点,这些数据点被称为“支持向量”。

1.4.1.3 间隔

间隔是指这些支持向量到超平面的距离,SVM的优化目标是最大化这个间隔。

1.4.1.3 核技巧

数据往往不是线性可分的。为了解决这个问题,SVM引入了核技巧。核函数允许SVM在高维空间中隐式地进行非线性映射,将数据从原始特征空间映射到一个更高维的空间,在这个高维空间中可能会变得线性可分。

1.4.1.4 C参数

参数C用于平衡间隔的最大化和错误的最小化之间的权衡。较小的C值会导致更大的间隔但可能容忍更多的错误分类,而较大的C值会强调正确分类但可能导致较小的间隔。

1.4.2 代码实现
1.4.2.1 导包

                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值