kaggle 数据竞赛:Titanic: Machine Learning from Disaster
https://www.kaggle.com/c/titanic
背景分析
沉没的泰坦尼克号是历史上最臭名昭著的沉船。1912年4月15日,泰坦尼克号撞上冰山后沉没,2224名乘客和机组人员1502人死亡。一个海难导致生命损失的原因是没有足够的救生艇的乘客和船员。除过有一些因素的影响,在沉船事故中,一些群体的人更可能生存其他群体更容易生还,比如妇女,儿童和上层阶级等。
问题概述
要求完成对具备什么特征的人可能生存的分析,使用机器学习算法来预测乘客是否能在悲剧中幸存下来。
数据处理
spass 基于临近点的线性趋势补全缺失数据: