【Python机器学习及实践】实战篇:泰坦尼克号罹难乘客预测

该博客介绍了使用Python进行泰坦尼克号乘客生存预测的项目,包括数据集理解、数据预处理和特征工程。通过分析训练和测试数据集,对缺失值进行处理,并利用随机森林、XGBoost等模型进行预测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python机器学习及实践——实战篇:泰坦尼克号罹难乘客预测


项目背景:

泰坦尼克号是一艘奥林匹克级邮轮,于1912年4月处女航时撞上冰山后沉没。泰坦尼克号由位于爱尔兰岛贝尔法斯特的哈兰德与沃尔夫造船厂兴建,是当时最大的客运轮船。在它的处女航中,泰坦尼克号从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰昆士敦,计划中的目的地为美国纽约。1912年4月14日,船上时间夜里11时40分,泰坦尼克号撞上冰山;4月15日凌晨2时20分,船裂成两半后沉入大西洋。泰坦尼克号海难为和平时期死伤人数最惨重的海难之一。船上1500多人丧生。

提出问题

预测泰坦尼克号乘客的生存情况

数据集

下载test.csv和train.csv。

说明:test.csv是训练数据集;train.csv是测试数据集。

数据理解

先读取数据集。

import pandas as pd

# 读取训练集和测试集
train = pd.read_csv('./train.csv')
test = pd.read_csv('./test.csv')
# 输出数据集的基本信息
print(train.inf
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

镰刀韭菜

看在我不断努力的份上,支持我吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值