机器学习-决策树之回归树案例(泰克尼克号)

这篇博客介绍了使用决策树进行回归分析的案例,聚焦于泰坦尼克号数据集。内容包括数据预处理,如删除无关特征和处理缺失值,特征与标签矩阵的提取,模型训练与预测。通过交叉验证和学习曲线评估模型性能,然后进行参数调优,使用网格搜索方法得到0.826的准确率。虽然有所提升,但模型仍有优化空间。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、决策树之回归树案例

1.导入相关库

import pandas  as pd 
from  sklearn.tree import DecisionTreeClassifier
import  matplotlib.pyplot as plt
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import  train_test_split,cross_val_score

2.读入数据,数据探索

data=pd.read_csv('data_1.csv')
data.head()
data.info()#分类器必须处理数值型的,需要把对象数据转换成数值型

结果显示:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 12 columns):
PassengerId    891 non-null int64
Survived       891 non-null int64
Pclass         891 non-null int64
Name           891 non-null object
Sex            891 non-null object
Age            714 non-null float64
SibSp          891 non-null int64
Parch          891 non-null int64
Ticket         891 non-null object
Fare           891 non-null float64
Cabin        
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值