前言
一直对大名鼎鼎的Kaggle竞赛有所耳闻,加上之前选修了《机器学习》课程并看了一点Ensemble Learning,所以趁着假期比较闲便想去了解一下Kaggle与数据分析。而Titanic大概是Kaggle领域里的Hello World与MNIST,因此打算先从它开始。不过因为这个竞赛我个人觉得是有一定门槛的,尽管机器学习算法都可以使用sklearn实现,数据的处理也可以通过pandas进行,但是数据分析与特征工程的难度还是不小的,Titanic从头到尾比着教程看下来也用了一整天的时间。
由于只是为了去了解基本的竞赛步骤,最后几乎完全是使用了《Kaggle Titanic 生存预测 – 详细流程吐血梳理》这篇博客里的代码,所以有需要的同学可以去看这篇博客。本文只是简单地总结一点个人的心得体会。
Kaggle竞赛
Overview of How Kaggle’s Competitions Work
From:https://www.kaggle.com/c/titanic/overview
- Join the Competition
Read about the challenge description, accept the Competition Rules and gain access to the competition dataset.- Get to Work
Download the data, build models on it locally or on Kaggle Kernels (our no-setup, customizable Jupyter Notebooks environment with free GPUs) and generate a prediction file.- Make a

本文详述Kaggle竞赛参与流程,以Titanic生存预测为例,深入解析数据预处理、特征工程、模型融合及预测技巧。从数据概览到模型优化,涵盖集成学习、sklearn、Pandas应用,适合初学者参考。
最低0.47元/天 解锁文章
1947

被折叠的 条评论
为什么被折叠?



