【R的机器学习】模型性能提升探索:支持向量机

本文介绍了支持向量机(SVM)的基本概念,通过森林分界线和山地树木分布的例子阐述其分类原理。SVM利用核技巧将数据映射到高维空间进行线性分类,区别于神经网络的非线性分类。通过iris数据集展示了SVM的建模过程,包括参数选择和模型评估,结果显示SVM在此案例中的准确率为93.3%,Kappa值为0.899。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这一章简单理解下大名鼎鼎的支持向量机,SVM;

还是先举个栗子:

有一条路把一片森林分开两块,左边是杨树,右边是松树,那么如果我们找一个分界线的话,当然就是这条路,这个是个很简单的分类方式;

下一个场景:
我们坐直升飞机在山顶飞过,这时候山对我们来说就是个平面,看到下面有两种树:松树和杨树,假设我们往下看的时候,发现杨树都在最外面一圈,而松树都在里面那一圈,我们用什么方法把他们分隔开呢?当然可以说我们画个圆就行,但是如果我们需要用一个平面来分类呢?

其实也好办,按照树木生长的属性,一般松树在山顶,杨树在山脚,如果我们下了直升飞机,侧面去看这个树木分布的话,是可以用一个平面去分割,类似如下图:
这里写图片描述

从平面到高维空间的变化,是通过一种核技巧(kernel)的方式,下面的视频可以更容易让人理解:

https://www.youtube.com/watch?v=3liCbRZPrZA

墙内:

https://v.qq.com/x/page/k05170ntgzc.html

那么理论上,SVM和神经网络都是用一种方式进行数据集的分类,我认为不同的地方主要就是分类的方式:
神经网络可以在同一平面用非线性的方式进

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值