低失真度量嵌入到恒定维度的研究
1. 高维数据嵌入的背景与目标
在数据处理中,有时源数据所在空间结构简单,比如具有欧几里得范数 $\ell_2$ 的 $\mathbb{R}^d$ 空间,但维度却极高。即便度量简单,高维度也会使许多算法的运行时间呈指数级增长,这就是所谓的“维度诅咒”。在这种情况下,嵌入的主要目标是降维,将数据映射到低得多的维度空间,即便度量未简化,也能提供显著帮助。
寻找低失真的度量嵌入优质算法并非易事,这一领域既具有明确的实际重要性,又蕴含着数学问题的内在美感。
2. 以往相关研究成果
有限度量空间的嵌入问题长期以来一直是广泛研究的主题,产生了大量成果。以下是一些关于将 $n$ 点度量空间低失真嵌入到 $\ell_d^p$($d \ll n$)的基本结果回顾:
- Bourgain 定理 :任何 $n$ 点有限度量空间都能以 $O(\log n)$ 的失真嵌入到欧几里得空间。后来 Linial、London 和 Rabinovich 证明该结果对任意 $p$ 的目标范数 $\ell_p$ 也成立,且目标空间维度最初是指数级的,后被他们和 Matoušek 降至 $O(\log^2 n)$,同时他们还证明了失真的 $\Omega(\log n)$ 下界。Abraham、Bartal 和 Neiman 进一步将目标维度降至 $O(\log n)$,并表明平均失真(而非最坏情况)可达到 $O(1)$。这一系列结果表明,当将一般的 $n$ 点度量空间嵌入到 $\ell_d^p$ 时,随着 $n$ 增大,$d$ 和失真都无法保持有界。
- Johnson - Lindens
超级会员免费看
订阅专栏 解锁全文
356

被折叠的 条评论
为什么被折叠?



