Titanic - Machine Learning from Disaster | Kaggle
train_data=pd.read_csv("/kaggle/input/titanic/train.csv")
# 从sklearn.ensemble模块导入RandomForestClassifier类
from sklearn.ensemble import RandomForestClassifier
# 从train_data数据集中提取Survived列,即乘客是否生存的结果
y = train_data["Survived"]
# 定义要用于训练的特征列名列表
features = ["Pclass", "Sex", "SibSp", "Parch"]
# 使用pandas的get_dummies函数对训练数据集中的特征进行独热编码
X = pd.get_dummies(train_data[features])
# 对测试数据集也进行同样的独热编码处理
X_test = pd.get_dummies(test_data[features])
# 创建一个随机森林分类器实例,设置参数:100棵树,最大深度为5,随机状态为1
model = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=1)
# 训练模型,使用训练数据集的特征X和生存结果y
model.fit(X, y)
# 使用训练好的模型对测试数据集X_test进行生存预测
predictions = model.pr