用xgboost构建一个简单的模型

本文通过xgboost构建一个简单的蘑菇毒性分类模型,利用UCI机器学习库的mushroom数据集,包含22个特征。首先导入所需工具包,然后读取libsvm格式的数据,设置训练参数,如最大深度、学习率等,进行模型训练,并用测试集进行预测。最后,通过可视化展示模型的决策树结构。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这篇文章我们使用xgboost构建一个简单的模型以及xgboost与scikit-learn一起使用构建模型,用到的数据集是UCI机器学习库的mushroom数据集,用数据集中的22个特征来判断蘑菇是否有毒,步骤如下:
1. 导入模型需要的工具包,这里面我们用到了xgboost, sklearn, matplotlib, time, graphviz

import xgboost as xgb
import time
import graphviz
from sklearn.metrics import accuracy_score
from matplotlib import pyplot

2.读取建模所需的数据集存储在对象dmatrix中,包括训练过程中所需的训练集和测试所需的测试集。该数据为libsvm格式的文本数据,样式为:1 101:1.3 202:0.03 1:2.1 , 开头的1位样本的标签,101,202,1是特征的索引,1.3, 0.03, 2.1是特征值。

# read in data
my_workpath = '/Users/huoshirui/Desk
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值