机器学习实战之一---简单讲解决策树

本文基于《机器学习实战》详细介绍了决策树算法,包括决策树定义、特征提取、信息增益计算、构造决策树的过程,并提供了python实现示例。讨论了其优缺点和适用数据类型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


前言:本文基于《机器学习实战》一书,采用python语言,对于机器学习当中的常用算法进行说明。

 

 

一、 综述

定义:首先来对决策树进行一个定义,决策树是一棵通过事物的特征来进行判断分支后得到该事物所需要的预测的属性的树。

流程:提取特征à计算信息增益à构建决策树à使用决策树进行预测

关键:树的构造,通过信息增益()得到分支点和分支的方式。

优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。

缺点:可能会产生过度匹配问题(过拟合)

适用数据类型:数值型和标称型。

以下是一棵决策树的简单例子,通过邮件的一些特征,来判断一个邮件的类型。

1


 

二、 特征提取

此处的特征指的就是用以构造决策树的实体集的特征,此处给出一个用以构造决策树的例子。

cheep

quality

buy

1

1

Yes

1

1

Yes

1

0

No

0

1

No

0

1

No

1

简单的对表1中的数据进行一个说明,表1表征了小明在购物时基于一个商品便宜

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值