SVM优点:
- 用于二元和多元分类器、回归和新奇性检测
- 良好的预测生成器,提供了鲁棒的过拟合、噪声数据和异常点处理
- 成功处理了涉及到很多变量的场景
- 当变量比样本还多是依旧有效
- 快速,即使样本量大于1万
- 自动检测数据的非线性,不用做变量变换
SVM缺点:
- 应用在二元分类表现最好,其他预测问题表现不是太好
- 变量比样例多很多的时候,有效性降低,需要使用其他方案,例如SGD方案
- 只提供预测结果,如果想要获取预测概率,需要额外方法去获取
- 如果想要最优结果,需要调参。
使用SVM预测模型的通用步骤
- 选择使用的SVM类
- 用数据训练模型
- 检查验证误差并作为基准线
- 为SVM参数尝试不同的值
- 检查验证误差是否改进
- 再次使用最优参数的数据来训练模型
SVM种类,用途和关键参数表

主要分为三类:1、分类 2、回归 3、异常检测
TIPs:SVM模块包含2个库:libsvm和liblinear,拟合模型时,python和这两个库有数据流,会消耗一部分内存。
如果内存足够,最好能够把SVM的cashe_size参数设置大于200M,例如1000M。
参数问题:
- C参数表明算法要训练数据点需要作出多少调整适应,C小,SVM对数据点调整少,多半取平均,仅用少量的数据点

本文详细介绍了支持向量机(SVM)的优势和局限性,包括其在二元分类、非线性处理及参数调优等方面的特点。通过手写数字识别问题展示了SVM的使用步骤,强调了C参数、核函数等关键参数的作用,并探讨了应对类不平衡问题的方法。最终,通过网格搜索确定最优C参数以提高模型性能。
最低0.47元/天 解锁文章
8789





