SVM-SVC分类

最新推荐文章于 2025-09-27 19:15:30 发布

原创

最新推荐文章于 2025-09-27 19:15:30 发布 · 1.7w 阅读

·

7

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文详细介绍了支持向量机(SVM)的优势和局限性，包括其在二元分类、非线性处理及参数调优等方面的特点。通过手写数字识别问题展示了SVM的使用步骤，强调了C参数、核函数等关键参数的作用，并探讨了应对类不平衡问题的方法。最终，通过网格搜索确定最优C参数以提高模型性能。

SVM优点：

用于二元和多元分类器、回归和新奇性检测
良好的预测生成器，提供了鲁棒的过拟合、噪声数据和异常点处理
成功处理了涉及到很多变量的场景
当变量比样本还多是依旧有效
快速，即使样本量大于1万
自动检测数据的非线性，不用做变量变换

SVM缺点：

应用在二元分类表现最好，其他预测问题表现不是太好
变量比样例多很多的时候，有效性降低，需要使用其他方案，例如SGD方案
只提供预测结果，如果想要获取预测概率，需要额外方法去获取
如果想要最优结果，需要调参。

使用SVM预测模型的通用步骤

选择使用的SVM类
用数据训练模型
检查验证误差并作为基准线
为SVM参数尝试不同的值
检查验证误差是否改进
再次使用最优参数的数据来训练模型

SVM种类，用途和关键参数表

主要分为三类：1、分类 2、回归 3、异常检测

TIPs:SVM模块包含2个库：libsvm和liblinear,拟合模型时，python和这两个库有数据流，会消耗一部分内存。

如果内存足够，最好能够把SVM的cashe_size参数设置大于200M，例如1000M。

参数问题：

C参数表明算法要训练数据点需要作出多少调整适应，C小，SVM对数据点调整少，多半取平均，仅用少量的数据点

最低0.47元/天解锁文章

评论 3

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。