机器学习实战之一---简单讲解决策树

最新推荐文章于 2022-10-22 15:45:41 发布

原创

最新推荐文章于 2022-10-22 15:45:41 发布 · 936 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #python #决策树 #人工智能

本文基于《机器学习实战》详细介绍了决策树算法，包括决策树定义、特征提取、信息增益计算、构造决策树的过程，并提供了python实现示例。讨论了其优缺点和适用数据类型。

前言：本文基于《机器学习实战》一书，采用python语言，对于机器学习当中的常用算法进行说明。

一、综述

定义：首先来对决策树进行一个定义，决策树是一棵通过事物的特征来进行判断分支后得到该事物所需要的预测的属性的树。

流程：提取特征à计算信息增益à构建决策树à使用决策树进行预测

关键：树的构造，通过信息增益(熵)得到分支点和分支的方式。

优点：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理不相关特征数据。

缺点：可能会产生过度匹配问题(过拟合)。

适用数据类型：数值型和标称型。

以下是一棵决策树的简单例子，通过邮件的一些特征，来判断一个邮件的类型。

图1

二、特征提取

此处的特征指的就是用以构造决策树的实体集的特征，此处给出一个用以构造决策树的例子。

cheep	quality	buy
1	1	Yes
1	1	Yes
1	0	No
0	1	No
0	1	No

表1

简单的对表1中的数据进行一个说明，表1表征了小明在购物时基于一个商品便宜(cheep)与否(1/0)以及质量(quality)好坏(1/0)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

class_brick

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

机器学习实战——决策树算法代码详解

QianLong_的博客

01-01

1079

机器学习实战——决策树算法代码详解刚开始学习机器学习，在熟悉python语法之后，看了李航的统计学习方法决策树的原理，自己推导了一遍，想用代码实现，但是无从下手。跟着机器学习实战的代码写了一遍，这本书的代码注释不多，不易理解，这里添加了理解后的详细注释。一起学习！ ID3算法，根据最大信息增益原理选择最优特征。下面附代码： from math import log import operat...

机器学习实战——决策树（代码）

Hu_Pengxue

07-03

1208

最近在学习Peter Harrington的《机器学习实战》，代码与书中的略有不同，但可以顺利运行。from math import log import operator # 计算熵 def calcShannonEnt(dataset): num = len(dataset) labelCounts = {} for featVec in dataset: ...

参与评论您还未登录，请先登录后发表或查看评论

《机器学习实战》——第3章代码详解（决策树）

yanyang42的博客

08-22

1267

from math import log import operator def createDataSet(): # 创建数据集 dataSet = [[1,1,'yes'], [1,1,'yes'], [1,0,'no'], [0,1,'no'],

《机器学习实战》读书笔记4：决策树源码分析

请叫我AXin

02-07

2091

本文对《机器学习实战》第三章——决策树的源码进行了全面的分析和解释。由于个人觉得作者的代码变量命名具有一定的迷惑性，使读者容易混淆，所以部分代码可能作了修改。本文只包含了构建决策树、用决策树分类、序列化决策树的代码。不包括画图的代码程序清单3-0：创建简单的数据集这部分是书上的python交互命令创建数据集的代码，写成函数，不用每次都输入一长传命令：def createDataSet():

机器学习实战-决策树算法

duanbin的博客

03-06

1537

本篇决策树算法是依据ID3算法来的，所以在看之间建议先了解ID3算法：https://blog.youkuaiyun.com/qq_27396861/article/details/88226296 文章目录第一步：构建决策树 案例，按照属性来分辨海洋生物：第一步：构建决策树 实例： # coding: utf-8 from math import log import operator def...

机器学习实战(第三章-决策树-ID3算法-所有代码与详细注解-python3.7)

12-09

决策树是一种广泛应用于数据挖掘和机器学习的监督学习方法，主要用作分类任务。ID3（Iterative Dichotomiser 3）算法是最早的决策树构建算法之一，由Ross Quinlan于1986年提出。这个压缩包文件包含了关于ID3算法的...

机器学习-决策树视频教学

06-09

总的来说，这个机器学习决策树视频教学课程是一个全面且实用的学习资源，它将引导你从基础知识到实战技巧，让你能够在人工智能领域熟练运用决策树算法。无论是对机器学习感兴趣的初学者还是希望进一步提升技能的专业...

决策树-基于Scikit-Learn的Python决策树算法解析与实战

12-07

从决策树的概念开始讲解，并逐步深入到使用Scikit-Learn库进行数据预处理、构建决策树模型、训练模型以及使用模型对新数据进行分类预测等方面的内容。同时探讨了决策树模型的可视化技巧和超参数调优的方法。还介绍了...

Scikit-Learn机器学习实战

最新发布

08-31

从数据预处理、特征工程到经典算法应用，涵盖线性回归、决策树、SVM及集成方法，结合真实案例解析模型评估与优化策略。特别探讨文本处理、异常检测与实时数据流等进阶主题，帮助读者掌握从入门到实战的全流程技能。...

sklearn中的分类决策树

前滩蜘蛛

09-23

438

转载： https://blog.youkuaiyun.com/fontthrone/article/details/78824242 <div id="article_content" class="article_content clearfix csdn-tracking-statistics" data-pid="blog" data-mod="popu_307" data-dsm="pos...

class1 决策树之分类树基础（详细版）

qq_44647559的博客

04-29

173

-------------------------------class1：分类树------------------------------------- from sklearn import tree from sklearn.datasets import load_wine # datasets：数据集（波士顿房价，鸢尾花，红酒） from sklearn.model_selection import train_test_split #训练集，测试集的类 wine = load_

决策树实现

chbxw

04-27

781

决策树理论 1.1、计算信息熵（经验熵） # 计算给定数据集的熵 def calc_shannon_entropy(data_set): # 数据集行数 num_entries = len(data_set) # 类标签字典 label_counts = {} # 遍历数据集, 记录每个标签的数量 for feat_vec i...

机器学习-class1

weixin_30553837的博客

12-14

132

机器学习算法监督学习 supervised learning 　　分类算法回归算法无监督学习 unsupervised learning 转载于:https://www.cnblogs.com/Mengchangxin/p/10122160.html...

李宏毅机器学习笔记(1)——Class 1 Introduction of Machine Learning(机器学习介绍)

©TyxMaek

06-21

468

【注】最近开始听台湾大学李宏毅的机器学习，是学长推荐的，并开始做相应的笔记和内容整理。详细可以访问课程主页 Machine Learning ≈ Looking for a Function Framework(框架) 机器学习的步骤很简单，就像把大象装进冰箱里一样简单。主要分为3步：（1）定义一组函数；（2）评价函数的好坏；（3）选择最好的函数。 Lear...

《机器学习》学习笔记（三）-- classification

DIAJEY的博客

07-29

1135

概念描述如何去分类？ 1.概念描述分类问题是找一个function，input一个object，输出的则是判断该object属于哪一个class 就以宝可梦为例，宝可梦有18种属性，现需要解决的分类问题就是做一个宝可梦种类的分类器输入数值化对于宝可梦分类问题，首先就要将一只宠物当作function的input–也就是数值化比如可以用一组数字来描述它的特性，比如：有多强（total strong）生命值（hp）攻击力（Attack）防御力（defense）特殊攻击力（Specia.

决策树的构建及可视化——帮自己配副隐形眼镜

python爬虫人工智能大数据

05-22

499

前文简介上一篇文章中主要介绍了以下几方面：决策树的简介决策树的流程熵的定义及如何计算熵信息增益的定义及如何计算信息增益依据信息增益划分数据集本文以一个新的数据集(隐形...

对于决策树上graphviz图像上的数值讲解

lsdniu的博客

12-03

1669

本题主要是以sk-learn中的红酒案例来说明内部分支上第一个为分类点 entropy为信息熵即不纯度(不纯度越低越好) samples为样本量 value为每样样本的样本容量 class主要显示出容量多的样本

【机器学习】07. 决策树模型DecisionTreeClassifier（代码注释，思路推导）

MZH

10-22

2万+

【机器学习】07. 决策树模型DecisionTreeClassifier（代码注释，思路推导）

【Python机器学习】——决策树DecisionTreeClassifier详解

机器学习实战之一---简单讲解决策树

一、 综述

二、 特征提取

一、综述

二、特征提取