Spark MLlib 机器学习之SVM支持向量机算法

本文介绍了SVM支持向量机的基本原理和优化策略,通过Spark MLlib库展示了如何在大数据场景下应用SVM进行线性分类,并详细解释了SVM的运行步骤,包括数据格式和代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 支持向量机(support vector machine),简称SVM。简单来讲,它是一种二类分类模型,能够将不同类的样本在样本空间中进行分隔。其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。

算法简介

SVM从线性可分情况下的最优分类面发展而来。最优分类面就是要求分类线不但能将两类正确分开,且使分类间隔最大。SVM的实质就是找出一个能将某个值最大化的超平面,这个值就是超平面离所有训练样本的最小距离。术语表示为“间隔”(margin)

 超平面可以用分类函数表示 ,在进行分类的时候,遇到一个新的数据点x,将x代入f(x) 中,如果f(x)小于0则将x的类别赋为-1,如果f(x)大于0则将x的类别赋为1。

实现步骤

  • 用数学定义要求解的问题

     SVM求一个平面S&#x

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值