1.熵.熵 表示随机变量不确定度的度量。也是平均意义上描述随机变量所需要信息量的度量。一个离散型随机变量的熵H(X)定义为:
H(X)=−∑x∈Xp(x)logp(x)
对数的底数通常为2,熵的单位是比特,同时也可以是e来表示。用统计学来解释就是函数 g(x)=log1p(x) 关于密度函数p(x)的期望
Ep(g(x))=H(X)
2.联合熵与条件熵. 对于服从联合分布为 p(x,y) 的一对离散随机变量 (X,Y) ,其 联合熵H(X,Y) 的定义为
H(X,Y)=−∑x∈X∑y∈Yp(x,y)logp(x,y)
相似的, 条件熵 为
H(Y