更多请参考这篇文章,对 JL \text{JL} JL很全面的一个综述
1. Johnson-Lindenstrauss \textbf{1. Johnson-Lindenstrauss} 1. Johnson-Lindenstrauss引理
1.1. \textbf{1.1. } 1.1. 引理内容
1️⃣原始 JL \text{JL} JL引理:存在一种方法,能将高维数据急剧压缩,并且各点间距离信息几乎不变
- 前提:对维度 d ∈ { 1 , 2 , . . . } d\text{∈}\{1,2,...\} d∈{ 1,2,...},小常数 ε ∈ ( 0 , 1 ) \varepsilon\text{∈}\left(0,1\right) ε∈(0,1),有限点集 X ⊆ R d X\text{⊆}{\mathbb{R}}^{d} X⊆Rd,投影后维度 m = Θ ( log ∣ X ∣ ε 2 ) m\text{=}\Theta\left( {\cfrac{\log\left|X\right|}{ {\varepsilon}^{2}}}\right) m=Θ(ε2log∣X∣)
- 结论:存在函数 ψ : X → R m \boldsymbol{\psi}\text{:}X\text{→}{\mathbb{R}}^{m} ψ:X→Rm,使得 ∀ u , v ∈ X \forall{u,v}\text{∈}X ∀u,v∈X有 ∥ ψ ( u ) – ψ ( v ) ∥ ℓ 2 2 ∈ ( 1 ± ε ) ∥ u – v ∥ ℓ 2 2 \|\boldsymbol{\psi}(u)–\boldsymbol{\psi}(v)\|_{\ell_2}^2\text{∈}(1\text{±}\varepsilon)\|u–v\|_{\ell_2}^2 ∥ψ(u)–ψ(v)∥ℓ22∈(1±ε)∥u–v∥ℓ22
2️⃣分布型 JL \text{JL} JL引理:存在分布 Ψ \Psi Ψ,从中抽取的线性投影 ψ \boldsymbol{\psi} ψ能将高维数据急剧压缩,且各点间距离大概率几乎不变
- 前提 1 1 1:对维度 d ∈ { 1 , 2 , . . . } d\text{∈}\{1,2,...\} d∈{ 1,2,...},小常数 ε , δ ∈ ( 0 , 1 ) \varepsilon,\delta\text{∈}\left(0,1\right) ε,δ∈(0,1),投影后维度 m = Θ ( 1 ε 2 log ( 1 δ ) ) m\text{=}\Theta\left( {\cfrac{1}{ {\varepsilon}^{2}}\log\left(\cfrac{1}{\delta}\right)}\right) m=Θ(ε21log(δ1))
- 前提 2 2 2:可从随机分布 Ψ \Psi Ψ( JL \text{JL} JL分布)中采样随机线性映射 ψ : R d → R m \boldsymbol{\psi}\text{:}{\mathbb{R}}^{d}\text{→}{\mathbb{R}}^{m} ψ:Rd→Rm( JL \text{JL} JL变换),即 ψ ( x ) = A x \boldsymbol{\psi}(x)\text{=}\textbf{A}x ψ(x)=Ax其中 A ∈ R m × d \textbf{A}\text{∈}{\mathbb{R}}^{m\text{×}d} A∈Rm×d
- 结论:分为对于单向量 u u u的界,以及双向量 u , v u,v u,v的联合界
- 单向量:对 ∀ u ∈ R d \forall{u}\text{∈}{\mathbb{R}}^{d} ∀u∈Rd,有 Pr [ ∥ ψ ( u ) ∥ ℓ 2 2 ∈ ( 1 ± ε ) ∥ u ∥ ℓ 2 2 ] ≥ 1 – δ \text{Pr}\left[\|\boldsymbol{\psi}(u)\|_{\ell_2}^2\text{∈}(1\text{±}\varepsilon)\|u\|_{\ell_2}^2\right]\text{≥}1–\delta Pr[∥ψ(u)∥ℓ22∈(1±ε)∥u∥ℓ22]≥1–δ
- 双向量:对 ∀ u , v ∈ X ⊆ R d \forall{u,v}\text{∈}X\text{⊆}{\mathbb{R}}^{d} ∀u,v∈X⊆Rd,另设 δ = 1 ∣ X ∣ 2 \delta\text{=}\cfrac{1}{|X|^2} δ=∣X∣21则有 Pr [ ∥ ψ ( u ) – ψ ( v ) ∥ ℓ 2 2 ∈ ( 1 ± ε ) ∥ u – v ∥ ℓ 2 2 ] ≥ 1 – δ ( ∣ X ∣ 2 ) ≥ 1 – 1 2 ∣ X ∣ \text{Pr}\left[\|\boldsymbol{\psi}(u)–\boldsymbol{\psi}(v)\|_{\ell_2}^2\text{∈}(1\text{±}\varepsilon)\|u–v\|_{\ell_2}^2\right]\text{≥}\displaystyle{}1–\delta\binom{|X|}2\text{≥}1–\cfrac{1}{2|X|} Pr[∥ψ(u)–ψ(v)∥ℓ22∈(1±ε)∥u–v∥ℓ22]

最低0.47元/天 解锁文章
646

被折叠的 条评论
为什么被折叠?



