二分类预测

本项目使用决策树、SGD、随机森林及梯度Boosting等算法,对俄亥俄州诊所患者是否出席的数据集进行二分类预测。通过特征探究、数据清洗和变量关系分析,最终梯度Boosting在ROC_AUC指标下表现最优。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本项目是数据的二分类分析,针对俄亥俄州诊所患者出现与否数据集No-show-Issue-Comma-300k进行样本的分类预测。首先进行特征探究,观察里面的连续变量,布尔值变量以及字符串变量,并绘制不同变量的分布图。然后对变量中的离群值以及明显错误数据进行清洗,探究各变量与状态变量之间的关系。最后分别用决策树,SGD,随机森林以及梯度Boosting对数据集做二分类预测,得到梯度Boosting在ROC_AUC指标下效果最好。

src="https://nbviewer.jupyter.org/github/wzy6642/Machine-Learning-Case/blob/master/noshowappointments/code/NoShowAppointments.ipynb" width="100%" height="1000">

github:https://github.com/wzy6642/Machine-Learning-Case

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值