任务
作业名称(详解):截图排名top20%及以上,描述一下模型的叠加对结果的影响,还有哪些方法可以对成绩有所提高?,之前的模型叠加的成绩不是很好,然后自己运用所学到的知识把排名提高到top10%,参考老师提供的代码方案,截图提交。
作业提交形式:PPT截图或手写拍照,打卡提交.
打卡内容:(可以只是文字提交,或图片提交,或组合都行)
文字要求最少200字
图片要求最少2张
打卡截止时间:1/11
打卡
stacking 是一种分层模型集成框架。以两层为例,第一层由多个基学习器组成,其输入为原始训练集,第二层的模型则是以第一层基学习器的输出作为特征加入训练集进行再训练,从而得到完整的stacking模型。将堆叠模型应用于实际大数据问题可以比单个模型产生更高的预测准确性和稳健性。模型融合之后能够小幅度的提高模型的预测准确度。
Blending大体与stacking类似,只是将Kfold CV改为了 HoldOut CV,也就是原来Kfold CV是等距划分训练集,HoldOut CV根据自己定义的百分比进行训练集测试集的划分。