数据挖掘学习笔记5-支持向量机SVM

支持向量机(SVM)是一种有效的分类算法,它通过最大化类别间间隔来构建分类器。对于线性可分和不可分样本,SVM分别采用硬间隔和软间隔策略,并利用核技巧将问题映射到高维空间,使得原本非线性的数据在高维中变得可分。这种方法巧妙地平衡了模型复杂度和泛化能力,降低了过拟合风险。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

支持向量机主要原理是在分类器可以将两类样本分开的基础上,通过最大化两类样本之间的间隔来选取分类器。距离算法如下
在这里插入图片描述
对于线性有重叠的样本,可采用软间隔,即放宽y(wx+b)≥1的条件,增加一个宽限值,使一些重叠样本也能被分类器分开。

对于线性不可分问题,SVM会先将样本输入映射到一个高维特征空间,一般来说维数越高能找到一个线性决策面的几率越大,而SVM精妙地选取了一个高维特征空间,使得高维的內积运算恰好等于低纬的內积运算的平方(或其他),这样既提升了样本的维度,又没有使运算变得特别复杂,这一类方法叫做核方法(K(Xi,Xj))。
在这里插入图片描述
VC Dimension:
模型的可分点(复杂程度)越多,测试误差比训练误差大的边界会越大(风险越大),因此尽量选用简单的模型
推荐阅读文献及更多资源:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值