菜菜的sklearn课堂回顾总结—决策树篇(2)

本文介绍了使用sklearn构建决策树的建模流程,强调了fit、score、get_params和predict等关键接口。文章探讨了决策树的不纯度概念,指出随机性在防止过拟合中的作用,如random_state和splitter参数。还详述了8个重要参数,包括criterion、max_depth、min_samples_leaf等,以控制模型复杂度和防止过拟合。最后预告将使用回归树解决泰坦尼克号案例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        上回书说到,决策树是一种非参数的有监督学习方法,它的作用是将表中数据所隐含的规律总结出来,并对新的输入数据进行基于已有规则的判断。决策树的两个核心问题是如何选择最佳的分枝特征以及如何防止过拟合。今天,我们将从应用sklearn来创建决策树这一视角出发,来简述一下回归树的建模流程以及重要参数。同样地,这次分享不涉及有关参数的数学原理,想看原理的朋友们可以有个心理预期啦。

---------------------------------------------------------------------------------------------------------------------------------

1.sklearn的建模流程

        几乎所有的sklearn上的模型都可以用下面的三步来建模;

        

         其中比较重要的接口是:

                fit —训练模型的接口,输入xtrain  ytrain

                score — 用与评测给定的测试数据与标签间的准确度,分数越高模型越好,输入xtest ytest

                get_params — 获取这个模型评估对象的参数

   

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值