最大熵和决策树


联合熵

H(X,Y)


条件熵

H(X,Y)-H(Y)=-\sum_{x,y}^{ }p(x,y)log p(x|y)

H(X|Y)=H(X)-I(X,Y)


相对熵

D(p||q)=\sum_{x}^{ }p(x)log\frac{p(x)}{q(x)}


互信息

I(X,Y)=\sum_{x,y}^{ }p(x,y)log\frac{p(x,y)}{p(x)p(y)}


H(X,Y)-H(X)=H(Y|X)

H(X)+H(Y)-H(X,Y)=I(X,Y)

H(Y)-H(Y|X)=I(X,Y)

H(Y|X)=H(Y)-I(X,Y)


ID3:信息增益

g(D,A)=H(D)-H(D|A)

H(D)=-\sum_{k=1}^{K}\frac{\left | C_{k} \right |}{\left | D \right |}log\frac{\left | C_{k} \right |}{\left | D \right |}

H(D|A)=-\sum_{i=1}^{n}\frac{\left | D_{i}\right |}{\left | D \right |}\sum_{k=1}^{K}\frac{\left | D_{ik}\right |}{\left | D_{i} \right |}log\sum_{i=1}^{n}\frac{\left | D_{ik}\right |}{\left | D_{i} \right |}


C4.5:信息增益率

g_{r}(D,A)=\frac{g(D,A)}{H(A)}


CART:Gini系数

Gini(p)=1-\sum_{k=1}^{K}\left ( \frac{\left | C_{k} \right |}{\left | D \right |} \right )^{2}


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值