过拟合

本文探讨了SVM(支持向量机)如何在具备强大描述能力的同时也易发生过拟合现象。通过解释过拟合的概念及SVM中最小化||W||的作用,文章进一步说明了正则化如何帮助SVM对抗过拟合,并比较了SVM与其他模型如RandomForest、AdaBoost等在过拟合方面的表现。

SVM当然会过拟合,而且过度拟合的能力还非常强。
首先我想说说什么叫过度拟合?
就是模型学岔路了,把数据中的噪音当做有效的分类标准。
通常越是描述能力强大的模型越容易过度拟合。描述能力强的模型就像聪明人,描述能力弱的如:”一次线性模型“像傻子,如果聪明人要骗人肯定比傻子更能自圆其说对不对?
而SVM的其中一个优化目标:最小化||W||,就是抑制它的描述能力,聪明人是吧,只允许你用100个字,能把事情说清楚不?这就是为什么regularization能够对抗过度拟合,同时它也在弱化模型的描述能力。但只要能说话就能说谎,就能歪曲事实对不对?
只有少数几种模型有抗过拟合的能力如Random Forrest,AdaBoost等
别把SVM想得太复杂,你就可以把它当做一个线性分类器只不过它优化了分类平面与分类数据之间距离。
把下面这三节课耐心的听完,对过拟合和SVM的理解就会心有所悟了。
加州理工学院公开课:机器学习与数据挖掘_LA___Lecture 12_ [ Regularization ]_网易公开课
加州理工学院公开课:机器学习与数据挖掘_NA___Lecture 14_ [ Support Vector Machines_网易公开课
加州理工学院公开课:机器学习与数据挖掘_OA___Lecture 15_ [ Kernel Methods ]_网易公开课

转载于:https://www.cnblogs.com/zhizhan/p/4535602.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值