决策分类树可视化以及手写代码寻找最佳分裂标准

最新推荐文章于 2025-07-31 17:56:49 发布

原创

最新推荐文章于 2025-07-31 17:56:49 发布 · 1.5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #机器学习 #sklearn #分类 #决策树

本文探讨了使用决策树解决QQ用户真实性的分类问题，通过可视化展示决策树，并详细介绍了如何手写代码依据信息熵增益选择最佳分裂条件，以实现最优的决策树划分。

文章目录

问题介绍
决策树可视化
手写代码实现最佳裂分标准

问题介绍

决策树是一种非线性解决回归或者分类的思路，这篇文章是从QQ的好友密度，日志密度，以及真实头像和QQ是否是真实用户的相关性出发，利用决策树分析问题。并且画出了决策树，还手写代码实现了决策树的分裂标准。

决策树可视化

# 导包
import pandas as pd 
import numpy as np
from sklearn.tree import DecisionTreeClassifier # tree模块中有回归树和分类树，此处导入分类树
from sklearn import tree

# 构建数据，s,m,l分别表示小，中，大
y = np.array(list('NYYYYYNYYN'))
X = pd.DataFrame({
   
   '日志密度':list('sslmlmmlms'),
                  '好友密度':list('slmmmlsmss'),
                  '真实头像':list('NYYYYNYYYY')})
X

	日志密度	好友密度	真实头像
0	s	s	N
1	s	l	Y
2	l	m	Y
3	m	m	Y
4	l	m	Y
5	m	l	N
6	m	s	Y
7	l	m	Y
8	m	s	Y
9	s	s	Y

# 在算法中计算，必须是数字，对字符串做相应的转换
X['日志密度']=X['日志密度'].map({
   
   's':0,'m':1,'l':2})
X['好友密度']=X['好友密度'].map({
   
   's':0,'m':1,'l'

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

python_xiaofeng

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

基于决策树的图像分类模型研究

AI天才研究院

07-21

3004

MNIST数据集由70000张训练图片和10000张测试图片组成，图片的尺寸为28x28像素，每张图片只有一个数字。数据集共有60个类别，分别对应0~9这十个数字。MNIST数据集一般用于神经网络的初期调试。

手写分类决策树（鸢尾花数据集）

qq_51879318的博客

06-12

6043

本次实验需要实现一个简单的分类决策树并在鸢尾花数据集上进行预测。鸢尾花数据集中共有150个样本，包含四个属性，值都是连续的，共有三种类别。使用分类决策树进行预测可以分为两个部分。第一部分是建立一棵决策树，在该部分我们需要判断在每个节点使用哪个属性的来划分左右子节点，并将信息储存在当前节点中，这里我们通过使划分后的“增益”最大来选择划分属性。在叶子节点，需要给出到达这个节点的数据的类别，以实现预测的功能。第二部分就是进行预测了，将数据输入决策树，通过储存在节点中的信息判断当前的数据怎么走，最终到达的叶子节

参与评论您还未登录，请先登录后发表或查看评论

决策树分类及可视化

weixin_41479099的博客

04-15

1133

#对癌症数据集使用决策树分类from sklearn.tree import DecisionTreeClassifiercancer =load_breast_cancer()X_train,X_test,y_train,y_test = train_test_split(cancer.data,cancer.target,stratify=cancer.target,random_state=...

决策树模型分类标准可视化

Jacquelin_1的博客

09-24

476

目的：可视化解释树模型* 电脑里要有graphviz brew install graphviz pip3 install -U pydotplus* 树模型： dtree = tree.DecisionTreeRegressor(max_depth = 2,min_samples_leaf = 500,min_samples_split = 5000) dtree = dtree.f...

DecisionTree决策树分类可视化

jn10010537的博客

10-06

1470

关于鸢尾花的数据集的介绍，见维基百科 https://en.wikipedia.org/wiki/Iris_flower_data_set 该数据集由来自三种鸢尾（Iris setosa，Iris virginica和Iris versicolor）中的每一种的50个样品组成。从每个样品测量四个特征：萼片和花瓣的长度和宽度，以厘米为单位。数据集包含一组150个记录，属于5个属性 - 花瓣长度，...

python可视化决策树

weixin_43823338的博客

09-28

508

直接上代码把： import pandas as pd from sklearn.tree import DecisionTreeRegressor from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error,r2_score,mean_absolute_error 读取数据： df=pd.read_csv('housing_data.csv') #数据是我自己以前爬

【Python机器学习系列】一文教你实现决策树模型可视化（案例+源码）

数据杂坛

08-01

764

一文教你实现决策树模型可视化（案例+源码）

决策树的实现及可视化方法总结

simon1223z的博客

11-07

4225

本文主要介绍回归树及分类树的实现方法及可视化方法

CART算法训练决策树的简单实现_python_代码_下载

06-07

CART算法的核心思想是通过分裂数据集来构建决策树，每次分裂的目标是最大化信息增益或基尼不纯度的减少。对于分类问题，通常使用基尼不纯度作为分裂标准；对于回归问题，则采用平方误差减少。在Python中，我们可以...

决策树分类：从理论到实战的全解析

最新发布

qq_74732076的博客

07-31

1146

决策树是一种基于树形结构的分类算法，通过特征的条件判断逐步划分数据，最终实现分类目标。其核心包括决策节点（特征划分）、叶子节点（分类结果）和树的深度控制。构建方法主要有基于信息增益的ID3算法和基于基尼指数的CART算法。决策树具有可视化强、计算复杂度低等优点，但也存在过拟合风险。实际应用中需通过剪枝、调参（如max_depth）和交叉验证来优化模型性能。在金融风控、医疗诊断等领域广泛应用，未来结合可解释AI和深度学习将有更大发展空间。

机器学习 - [源码实现决策树小专题]决策树如何分裂以拓展节点（以及在不允许调用sklearn等库的源代码实现）

jclee95的个人博客

03-18

754

机器学习 - 决策树如何分裂以拓展节点【导读】：节点的分裂是决策树建立重要的一个环节。本文在实现求解最佳特征和划分数据集的基础上带领大家实现如何实现决策树的分裂以拓展节点、最终建立一颗分类树。 1.文本引用的一些函数本文将用到其它的一些函数，这里将只展示它们的接口。这写函数也是在假设不允许调用sklearn等现成及其学习库的前提下，我自己写的。具体实现方法以及教程请依据链接跳转到对应的博文进行查看。博文1：混杂度的计算及其编程实现 def impurity(anArray, impurity

常用特征选择

qq602683200的博客

10-21

1203

#常用特征选择方法特征选择对于数据科学家、已经机器学习有关研究人员非常重要，通过减少特征数量、增加模型泛化能力，减少过拟合，能够增加特征之间的理解，降低学习任务的难度，提升模型的效率。常用的特征选择法分为：目录1. 过滤式（filter）1.1 方差选择法1.2 相关系数法1.3 卡方检验法2. 包裹式（wrapper）3.嵌入式（embedding） 1. 过滤式（filter）通过一定的统计方法对每个特征进行评分排序，然后按照一定的规则过滤出最优的特征子集，然后在训练学习器，由于过滤不需要考虑后续

逼真，特别逼真的决策树可视化

01-15

1276

同学们好，决策树的可视化,我以为之前介绍的方法已经够惊艳了（[决策树可视化，被惊艳到了！](https://mp.weixin.qq.com/s?__biz=MzA4MjYwMTc5Nw==&mid=2648960771&idx=1&sn=4018c10f946c354be3b6f742222f61d6&chksm=87947d29b0e3f43ff29d42282ec40dc0dd1b2e46100f66805a81034ffc966188.

手写决策树并可视化

我有颗小粒的痣

09-28

2930

决策树 可视化 描述采用数据为UCI数据库中的Lenses Data Set(https://archive.ics.uci.edu/ml/datasets/Lenses) 包含 24个实例 3个分类： 1 : the patient should be fitted with hard contact lenses, 2 : the patient should be fitted wit...

ML入门2.0 -- 手写决策树（Decision Tree）

weixin_39956363的博客

05-14

1868

ML入门2.0 手写决策树（Decision Tree）决策树简介决策树原理决策树举例实验截图：数据集导入使用ID3分类算法使用C4.5（这里是J48）手写ID3运行结果：完整版程序见githhub 决策树简介 Decision Tree 中文称为决策树，是ML中第二种十分经典的算法，顾名思义其算法结构为树形结构，与上一篇博客中介绍的KNN 类似都可以用来解决分类问题的算法。 决策树由下面三种元素构成：根结点：样本数据的全集内部节点：按不同特征属性划分的集合叶节点：决策的结果 决策树是

决策树实现手写体识别

qq_46618854的博客

10-28

4623

文章目录决策树识别手写体前言实现步骤所需的库导入数据集信息熵选出信息增益最高的属性选出信息增益率最高的属性选出基尼指数最低的属性生成决策树展示树测试决策树简单实现演示展示树图信息增益图信息增益率图基尼指数图结果分析 决策树识别手写体前言 决策树(Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是

决策树可视化以及数据所要的处理（查漏补缺）

qq_57391626的博客

10-28

469

决策树可视化以及数据所要的处理

python决策树可视化_「决策树」| Part3—Python实现之可视化

weixin_39667080的博客

12-01

651

文章首发于微信公众号：AlgorithmDeveloper，专注机器学习与Python，编程与算法，还有生活。1.前言「决策树」| Part2—Python实现之构建决策树中我们已经可以基于给定数据集训练出决策树模型，只不过是以字典方式表示决策树，决策树直观、易于理解的优点完全体现不出来。因此，这篇文章的目的就是将训练出的决策树模型以树状图形表示。给定数据集：字典形式决策树模型：{'人品': {'...

机器学习决策树的分裂到底是什么？这篇文章讲明白了！

weixin_33849215的博客

06-14

939

作者 | Prashant Gupta译者 | AI100（rgznai100）在实际生活中，树的类比如影随形。事实证明，树形结构对于机器学习领域同样有着广泛的影响，特别是对分类和回归两大任务来说。在决策分析中，决策树可以非常清晰地呈现决策的过程和结果。“树”如其名，决策树所用的正是一个树形的决策模型。数据挖掘领域经常会用决策树来搜寻给定问题的解决策略，机器学习领域同样会广泛用到这一方法。这将会是...