“交叉熵”如何做损失函数? 熵熵的定义相对熵-KL散度神经网络怎么利用交叉熵 熵 模型的复杂程度 牛顿对力的定义: 自洽自己的力学体系: 计算机随机输入一个16位的二进制数,这个数的概率是1/2^16,一旦输入,它的概率就被变成了1,整件事的信息量为16比特。 熵就是衡量系统从不确定的状态到确定的状态难度有多大。 熵的定义 对这个系统求信息量的期望 相对熵-KL散度 交叉熵越小,代表两个概率模型越接近。 神经网络怎么利用交叉熵 极大似然估计的log是为了把连乘换成连加 交叉熵log是写在定义里的,以2为底是为了最后计算出来的单位是比特 负号也是不一样的,加大似然估计是为了求极大值转化为求极小值,交叉熵负号是写在定义里的