Kaggle搭积木式刷分大法: LB 0.11666(排名前15%)

本文作者分享了在Kaggle比赛中通过特征工程提高得分的经验,特别是利用Pandas的Pipe和Sklearn的Pipeline进行数据处理。强调了特征工程的重要性,并详细介绍了如何构建特征工程流程,包括数据预处理、多种处理方法的组合以及通过R2值筛选有效特征。文章还概述了后续的机器学习阶段,包括模型训练、调参和集成方法,以达到稳定的LB分数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

專 欄

❈本文作者:王勇,目前感兴趣项目商业分析、Python、机器学习、Kaggle。17年项目管理,通信业干了11年项目经理管合同交付,制造业干了6年项目管理:PMO,变革,生产转移,清算和资产处理。MBA, PMI-PBA, PMP。❈

我参加了两个Kaggle 比赛,一个是Titanic (分类),另一个是HousePrice(回归)。分别获得了前7% (花了约3个月业余时间)和前13%排名(花了约2个月业余时间)的成绩。由于刚刚上手5个月机器学习,其中花了很多时间作重复和无用功。

本文的目的主要是分享和探讨:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值