H
(
X
)
=
∑
x
∈
X
−
P
(
x
)
l
o
g
(
P
(
x
)
)
H(X)=\sum \limits_{x \in X}-P(x)log(P(x))
H(X)=x∈X∑−P(x)log(P(x))
信息增益
特征A对训练样本集D的信息增益g(D,A),定义为集合D的信息熵H(D)与特征A给定的条件下D的信息条件熵H(D|A)只差 即公式为
g
(
D
,
A
)
=
H
(
D
)
−
H
(
D
∣
A
)
g(D,A)=H(D)-H(D|A)
g(D,A)=H(D)−H(D∣A) 表示得知特征X的信息而使得类Y的信息的不确定性减少的程度