0.起源
物理学中的热力学 熵:度量分子在物理空间中的混乱程度;
1.信息熵
信息熵: 度量信息量的多少;
以离散信息为例
离散符号:x1,x2,…,xn;
信息中各符号出现的概率:p1,p2,…,pn;
信息的不确定性函数: f: p—f(p);
p越大,信息的不确定性越小,因此f是一个 减函数;
假设前提: 各符号的出现是相互独立的(与实际不符)
则:f(p1,p2)=f(p1)+f(p2),即f具有可加性;
满足 减函数和可加性 的不确定性函数f 定义为:

信息熵: 信息的平均不确定性

2.交叉熵
主要用于度量两个概率分布间的差异性信息。
P–X 真实分布 ; Q–Y拟合分布