最优传输问题_transport polytope-优快云博客

本文探讨了TransportPolytope的概念，它表示联合概率的集合，并定义了在概率向量之间的最优传输问题。通过Frobenius点积，计算从一个分布到另一个分布的最优传输成本，涉及d×d矩阵的非负传输矩阵。该问题与随机变量的联合概率分布相关，且在给定代价矩阵时可以求解。最优传输问题在计算复杂度上具有挑战性，但有算法可以在O(d³logd)时间内找到解。此外，当代价矩阵是度量矩阵时，最优传输距离是概率分布之间的距离。

最优传输问题

- - Transport Polytope、可解释为联合概率的集合
  - $r$ 和 $c$ 之间的最优传输

Transport Polytope、可解释为联合概率的集合

使用 $\lang \cdot , \cdot \rang$ 代表Frobenius点积。对于 $\sum_d:=\{x\in\R^d_+:x^T1_d=1\}$ 中的两个概率向量 $r$ 和 $c$ ，将 $U (r, c)$ 记为 $r$ 和 $c$ 的transport polytope，称为 $d\times d$ 矩阵的polyhedral集合， $1_d$ 为值全为1的d维向量
$U(r,c):=\{P\in \R^{d\times d}_+|P1_d=r,P^T1_d=c\}$ .
$U (r, c)$ 包含所有 $d\times d$ 的行和列的和分别 $r$ 和 $c$ 的非负矩阵。 $U (r, c)$ 的概率解释为：对于X和Y这两个取值为 ${1,...,d\}$ 的多项随机变量，其分布分别为 $r$ 和 $c$ ，集合 $U (r, c)$ 包含 $(X, Y)$ 的所有可能的联合概率。实际上，任意矩阵 $P\in U(r,c)$ 与 $(X, Y)$ 的联合概率等价， $p(X=i,Y=j)=p_{ij}$ 。将熵 $h$ ， $P,Q\in U(r,c)$ 的Kullback-Leibler散度和边缘参数 $r\in \sum_d$ 记为
在这里插入图片描述

$r$ 和 $c$ 之间的最优传输

给定 $d\times d$ 的代价矩阵 $M$ ，从 $r$ 映射到 $c$ 的代价可以用传输矩阵(transport matrix)（或联合概率）量化为 $\lang P, M\rang$ 。
$\boxed{d_M(r,c):=\min_{P\in U(r,c)}\lang P,M\rang}$ (1)
等式(1)称作给定代价矩阵 $M$ 时， $r$ 和 $c$ 的最优传输(OT)问题。除其他方法外，使用network simplex(Ahuja et al., 1993, §9)可以得到该问题的最优表 $P^*$ 。当M是度量矩阵时，该问题的最优解 $d_M(r,c)$ 是 $r$ 和 $c$ 的距离(Villani, 2009, §6.1)，称为M属于距离矩阵的锥。(Avis, 1980; Brickell et al., 2008)
在这里插入图片描述
在近期提出的算法之中，对于一般的矩阵 $M$ ，最优解的计算复杂度在最差情况下，范围在 $O(d^3\log d)$ 之间，实际上也是超立方(Pele and Werman, 2009, §2.1)