软间隔支持向量机

软间隔支持向量机通过引入错误容忍度防止过拟合,允许一部分样本分类错误。通过调整参数C平衡模型复杂度与错误率。通过对偶形式优化,解决非线性问题并区分错误程度。αn的不同取值对应不同物理意义,揭示样本在模型中的角色。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

软间隔支持向量机

SVM可能会造成overfit,因为kernel可能很复杂,而且必须将所有的样本都分类正确,造成模型过于复杂
那么如何避免过拟合?
方法是允许有分类错误的点,即把某些点当做是noise,但是尽量让这些noise个数越少越好

hard-margin SVM:
min(b,w)12wTws.t. yn(wTzn+b)≥1 for all nmin_{(b,w)} \frac{1}{2}w^Tw \\ s.t. \ y_n(w^Tz_n+b) \geq1 \ for \ all \ n min(b,w)21wTws.t. yn(wTzn+b)1 for all n
为了引入允许犯错误的点,做一些修改:
min(b,w)12wTw+C∑n=1N[yn≠sign(wTzn+b)]s.t. yn(wTzn+b)≥1for correct nyn(wTzn+b)≥−∞min_{(b,w)} \frac{1}{2}w^Tw + C\sum_{n=1}^{N}[y_n\ne sign(w^Tz_n+b)]\\s.t. \ y_n(w^Tz_n+b)\geq 1 for \ correct\ n\\ y_n(w^Tz_n+b)\geq-\inftymin(b,w)21wTw+Cn=1N[yn̸=sign(wTzn+b)]s.t. yn(wTzn+b)1for correct nyn(wTzn+b)
对于分类错误的条件是没有限制,修正后的目标除了12wTw\frac{1}{2}w^Tw21wTw,还多了yn(wTzn+b)≥1y_n(w^Tz_n+b)\geq1yn(wTzn+b)1,即noise点的个数,参数C的引入是为了平衡第一项和第二项的关系
再对上述条件做修正,将两个条件合并:
min(b,w)12wTw+C∑n=1N[yn≠sign(wTzn+b)]s.t. yn(wTzn+b)≥1−∞[yn≠sign(wTzn+b)]min_{(b,w)} \frac{1}{2}w^Tw + C\sum_{n=1}^{N}[y_n\ne sign(w^Tz_n+b)]\\s.t. \ y_n(w^Tz_n+b)\geq 1 - \infty[y_n\ne sign(w^Tz_n+b)]min(b,w)21wTw+Cn=1N[yn̸=sign(wTzn+b)]s.t. yn(w

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值