比较两个概率分布(或概率密度函数)相似性或距离,虽然可用KL散度,但它不具有相互对等性,而用EMD表示就显得自然。
在此也不需要标准EMD版本,仅需要最基本的搬运距离性质。
想象一个直方图A中每一点的数据,有一部分随机散落到附近的点位,最终变成了另一个直方图B。
我们想把B复原为A。B各点或短缺,或盈余,所缺的就从附近取,多余的就填到附近…这样付出的最小代价就是AB的距离。
这里代价或费用用距离与搬运量的乘积表示。如果AB变化过程混入噪声,那么不会得到与A完全相等的结果,这时与A逐点的差异也算作费用。
就这么简单!

8007

被折叠的 条评论
为什么被折叠?



