浅谈支持向量机

最新推荐文章于 2023-06-26 23:33:10 发布

原创

最新推荐文章于 2023-06-26 23:33:10 发布 · 601 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#csdn博客 #机器学习 #算法 #machine learning

支持向量机（SVM）是一种两类分类模型，基本模型是定义在特征空间上的间隔最大的线性分类器。它还包括核技巧，这使它成为实质上的非线性分类器。SVM的学习策略就是间隔最大化。假设给定一个特征空间上的训练数据集T={(x1,y1),(x2,y2),......(xN,yN)}, N 为特征数目，yi为标记。(xi,yi)为样本点。学习的目标是在特征空间中找到一个超平面，能够将实例分到不同的类。

一、线性可分支持向量机

线性可分支持向量机针对于训练数据集线性可分，利用间隔最大化求最优分离超平面。

超平面方程为
分类决策函数为

图 1
考虑如图所示的二维特征空间中的分类问题。图中“o”白表示正例，“+”表示反例。训练数据集线性可分时，可以找到一条直线将两类数据正确划分，并且间隔最大。

1、函数间隔和几何间隔

图1所示，有A,B,C三个点，表示3个实例，均分离在超平面的反例的一侧，预测他们的类，点A离分离超平面较远，若预测该点为反例，则比较可信，点C离分离超平面较近，若预测该点为反例，则不太可信，点B在A,C之间，可信度在点A，C之间。

一般来说，一个点距离分离超平面的远近可以表示分类预测的确信程度。在超平面w*x+b=0确定的情况下，|w*x+b|能够相对的表示点x距离超平面的远近。而 w*x+b 的符号与类标记 y的符号是否一致能够表示分类是否正确，所以可以用 y(w*x+b)来表示分类的正确性和确信度。

函数间隔：对于给定的训练数据集 T 和超平面（w, b），定义超平面 (w, b)关于样本点 (xi,yi)的函数间隔为：

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。