
Kaggle
峰峰jack
这个作者很懒,什么都没留下…
展开
-
Kaggle(1):数据挖掘的基本流程
我觉得做任何事情,一定要有章法。对于学习类的事情,就是要有框架。第一次打Kaggle比赛,我的一个重要收获就是初步搞清楚了打这类比赛的框架。可以分为以下六步:理解问题、分析问题、算法选择、结果评价、算法调优、提交和总结。要想很好的完成比赛,这六步缺一不可。1)理解问题 也就是认真读题,在这一步,最重要的是有耐心。不要想着多么迅速的把这一步搞定,最终的目的是要把问题理解清楚,包括:要解决原创 2016-03-09 23:30:42 · 2144 阅读 · 0 评论 -
Kaggle(2):验证和过分拟合
过分拟合(overfitting)的直接结果是:对于训练集样本数据的交叉验证精度很高,但是用在实际测试集数据上,预测精度要低许多。有时候为了使模型对实际(或测试)样本具有更高的预测精度,要适当降低模型在训练样本集上的预测准确度,避免由于过拟合所造成的适应性降低问题。原创 2016-03-10 23:45:32 · 1630 阅读 · 0 评论