Johnsen-lindenstrauss定理(J-L定理)

最新推荐文章于 2022-02-14 17:06:42 发布

原创最新推荐文章于 2022-02-14 17:06:42 发布 · 6.4k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#J-L定理 #压缩感知 #随机算法

索引技术专栏收录该内容

16 篇文章

订阅专栏

本文介绍了J-L定理，该定理指出高维空间中的点集可通过随机投影映射到低维空间，同时保持点间距离不变。文章还讨论了定理的应用场景，并给出了一种实现映射的具体方法。

前言

J-L定理是我在阅读关于汉明嵌入的文章时遇到最多的一次概念，其主要是说“一个 $d$ 维空间中的 $n$ 个点可以近似等距地嵌入到一个 $k \approx O(logn)$ 维的空间”，所谓近似等距意思简单地理解就是保持任何两个点之间的相对远近关系，准确但不确切的说法是拓扑同构。该定理是1984年发现的，在压缩感知、流行学习和降维上被应用。ps:应该是个很牛逼的定理。

J-L定理

表述

对任意常数 $0 < ε < 1$ 和任意正整数 $n$ , 设 $k$ 为一个正整数

k \geq 4 (ϵ 2 / 2 - ϵ 3 / 3) - 1 ln n

$k\ge4(\epsilon^2/2-\epsilon^3/3)^{-1}\ln n$
那么对于任意

Rd ${R}^d$ 空间中的

n $n$ 个点构成的集合V，始终存在一个映射

f:Rd→Rk使得对所有的u,v∈V, $f:\mathbf{R}^d\rightarrow\mathbf{R}^k 使得对所有的 u,v\in V,$ 有

(1 - ϵ) ∥ u - v ∥ 2 \leq ∥ f (u) - f (v) ∥ 2 \leq (1 + ϵ) ∥ u - v ∥ 2 .

$(1-\epsilon)\|u-v\|^2\le\|f(u)-f(v)\|^2\le(1+\epsilon)\|u-v\|^2.$
且该映射可以在多项式时间内找到。

从上述定理的表述中可以发现：
1.所使用的距离是低维空间中常用的欧氏距离。
2.原始空间中的点数充分决定了降维后空间可以达到的最小维数。
3.不管空间维数，假设原始空间有100万个点，可降维后的空间维数与 $ε$ 的关系如下，当取 $ε =0.5$ ，可以嵌入的最低维空间为664维。
这里写图片描述
4.降维时若要求保持等距关系越严格，则 $ε$ 应该越小，但是降维后的空间最低维数也会越大，这中间应该有个权衡（trade-off）。
5. J-L定理给出了低维空间嵌入的误差上界，但这种误差是相对误差。因为以下两个式子等价的。