蒙特卡罗矩阵乘法采样技术及其在图像处理中的应用
1. 引言
现代海量数据集具有前所未有的特征和挑战,使得大多数传统的确定性算法在大规模矩阵计算中变得不适用。近年来,使用一定随机性的策略受到了广泛关注,即所谓的随机算法。随机算法为解决线性代数问题(如矩阵的低秩近似计算、矩阵分解和矩阵投影)提供了一种高效且可靠的方法,同时也出现了基本矩阵运算的随机版本,例如 BasicMatrixMultiplication(BMM)算法。
矩阵计算中随机算法的关键在于矩阵列或行的随机选择标准,即采样策略。理论上,明智选择的非均匀采样可以获得高质量的近似结果,因此应优先于均匀采样等更明显的选择。例如,有人提出了一种名为最优概率的采样策略,并且具有一定的最优性。最近又提出了一个新的标准,在特定的信息检索问题中,这两个标准是一致的。
然而,本文聚焦于逆问题(特别是图像处理)中的病态矩阵的随机矩阵乘法。通过实验研究,比较了在 BMM 算法中不同采样标准在这类矩阵上的性能。结果表明,输入矩阵的条件数在很大程度上决定了采样策略的选择。对于随机矩阵,最优采样的表现符合理论预测;但对于病态矩阵,均匀采样能产生更准确的近似结果。基于此,本文提出了一种新的采样策略——分段均匀采样,用于图像分割中的亲和矩阵乘法。
2. 蒙特卡罗矩阵乘法算法
BMM 算法用于计算一个 $m × n$ 矩阵 $A$ 和一个 $n × p$ 矩阵 $B$ 的乘积 $AB$ 的近似值。其主要思想是将矩阵乘积表示为外积形式,即 $AB$ 可以写成 $n$ 个秩为 1 的矩阵之和($A$ 的列与 $B$ 的对应行的乘积),然后选择其中一些项来近似该乘积:
$AB = \sum_{t = 1}^