SVM模型进行分类预测时的参数调整技巧

一:如何判断调参范围是否合理

正常来说,当我们参数在合理范围时,模型在训练集和测试集的准确率都比较高;当模型在训练集上准确率比较高,而测试集上的准确率比较低时,模型处于过拟合状态;当模型训练集和测试集上准确率都比较低,模型处于欠拟合状态。正常来说测试集上的准确率都会比训练集要低。

二:如何确定参数的调节方向

当使用线性支持向量机时,我们只需调节正则化参数C的范围即可。

这里我们以RBF作为核的SVM为例,这时候我们需要调节的参数是正则化参数C和核函数参数gamma。为了保证调参的精确度,一般我们都使用网格搜索法来确定参数。

网格搜索法就是给出各个参数的调节范围和调节步长,计算出每个参数的可能取值,然后遍历所有的组合情况,返回最佳的参数值。
C和gamma的有效范围是:10-8~108;

C表示模型对误差的惩罚系数,gamma反映了数据映射到高维特征空间后的分布;C越大,模型越容易过拟合;C越小,模型越容易欠拟合。gamma越大,支持向量越多,gamma值越小,支持向量越少。gamma越小,模型的泛化性变好,但过小,模型实际上会退化为线性模型;gamma越大,理论上SVM可以拟合任何非线性数据。
为维持模型在过拟合和欠拟合之间的平衡,往往最佳的参数范围是C比较大,gamma比较小;或者C比较小,gamma比较大。也就是说当模型欠拟合时,我们需要增大C或者增大gamma,不能同时增加,调节后如果模型过拟合,我们又很难判断是C过大了,还是gamma过大了;同理,模型欠拟合的时候,我们需要减小C或者减小gamma。

三:设置合理的调参起始点
因为SVM本身是一个非线性模型,调参的时候根据项目的不同,每一次都是从头开始的。如果想把上一个项目调好的参数套用到下一个项目上,往往没什么效果。正常情况下,我们都会先设置C和gamma的值在0.1~10之间,然后在根据模型的表现,每次乘以0.1或者10作为一个步长,当确定大致范围后,再细化搜索区间。

转自https://www.cnblogs.com/yuehouse/p/9742697.html

SVM回归中最重要的参数是核函数类型、惩罚参数C和核函数参数γ。以下是一些调整SVM回归模型参数技巧: 1. 核函数类型:SVM回归中常用的核函数有线性核、多项式核和径向基函数(RBF)核。如果数据特征比较简单,可以使用线性核,如果数据特征较为复杂,则可以使用多项式核或RBF核。 2. 惩罚参数C:惩罚参数C是SVM回归中控制错误分类惩罚和模型复杂度的重要参数。当C值较小模型更加关注分类边界,容易出现欠拟合;当C值较大模型更加关注分类准确性,容易出现过拟合。可以通过网格搜索或交叉验证来选择最优的C值。 3. 核函数参数γ:对于RBF核,γ是一个重要的参数,控制着决策边界的形状。当γ值较小,决策边界更加平滑,容易出现欠拟合;当γ值较大,决策边界更加复杂,容易出现过拟合。可以通过网格搜索或交叉验证来选择最优的γ值。 4. 数据预处理:在训练SVM回归模型之前,需要对数据进行预处理,如标准化或归一化。这可以使得不同特征之间的尺度一致,训练出更加稳定和准确的模型。 5. 正则化:正则化是一种常用的技术,可以降低模型的复杂度,避免过拟合。可以在SVM回归模型中引入正则化项,如L1或L2正则化,来控制模型的复杂度。 6. 模型集成:可以使用模型集成技术来提高模型的性能和稳定性,如Bagging或Boosting。这些技术可以通过组合多个SVM回归模型来减少模型的方差,并提高模型预测能力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值