机器学习实战--决策树

本文详细介绍了分类决策树和回归决策树的原理与应用。包括决策树的API参数解释、使用场景及如何通过调整参数来提高模型的泛化能力。并提供了鸢尾花数据集的分类分析及回归分析的代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分类决策树

API

class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, class_weight=None, presort=False)

几个重要的参数:

  • criterion:分类标准:信息熵或者gini系数
  • splitter:取最好的点分隔树或者随机分隔,最好的点是贪心的思想,随机分隔是想获得更好的泛化能力。
  • max_depth:预剪枝,限制树的深度,提高泛化能力
  • max_features:每次随机选择部分节点,而不是全部,再从这部分中选一个进行分隔,提高泛化能力。

代码例子:
对鸢尾花的数据集进行分析:
https://github.com/xiayto/Mechine_learning/blob/master/DecisionTree/DecisionTree.py

回归决策树

API

与分类决策树类似,用CART划分标准,在分类中,CART用的是gini系数,在回归中用的是MSE。

代码样例

https://github.com/xiayto/Mechine_learning/blob/master/DecisionTree/DecisionTreeRegression.py

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值