《统计学习方法》学习笔记(第五章)

本文介绍了决策树的学习方法,重点讲解了ID3算法(基于信息增益)、C4.5(基于信息增益比)和CART(基于Gini指数)算法。通过理解熵、信息增益、信息增益比和Gini指数,阐述了决策树的构建过程。同时提到了静态方法在Python中的应用,并讨论了Graphviz的安装与配置问题,以及如何为Python加载Graphviz库。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第5章 决策树

ID3算法(基于信息增益)

entropy(信息熵): H ( x ) = − ∑ i = 1 n p i log ⁡ p i H(x) = -\sum_{i=1}^{n}p_i\log{p_i} H(x)=i=1npilogpi

#熵
def calc_ent(datasets):
    data_length = len(datasets)
    #类别是/否
    label_count = {}
    for i in range(data_length):
        label = datasets[i][-1]
        if label not in label_count:
            label_count[label] = 0
        label_count[label] += 1
    ent = -sum([(p/data_length)*log(p/data_length,2)for p in label_count.values()])
    return ent

conditional entropy(条件熵): H ( X ∣ Y ) = ∑ P ( X ∣ Y ) log ⁡ P ( X ∣ Y ) H(X|Y)=\sum{P(X|Y)}\log{P(X|Y)} H(XY)=

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值