灵活聚合相似性搜索算法解析与实验评估
1. 算法基础与理论分析
在灵活聚合相似性搜索中,为了使近似尽可能紧密,引入了一个下界比率 $\lambda_i \geq 1$,满足不等式 $\lambda_id(M_i, v) \leq D_{\varphi}(Q, v) + \alpha_i$。对于每个对象 $v \in U$,需要考虑使该不等式成立的最大可能的下界比率 $\lambda_i$,理想情况下,$\lambda_i$ 应设为满足所有对象 $v$ 的最小最大值。
对于 FADT AVG 算法,由于空间限制,仅简要概述其形式理论分析,该分析从终止参数 $t$ 的选择角度确立了方法的准确性。证明策略基于对从查询对象的最小包围球 MEB(Q) 的中心 $q^ $ 进行扩展搜索时遇到的项的最大扩展率的假设,此假设体现在 $t$ 的选择上。在搜索的任何阶段,如果未访问的查询结果对象的存在表明扩展率将超过 MaxGED($q^ $, $k + 1$) 所暗示的限制,则可得出不存在此类未访问结果对象的结论。
定理 1 指出:
- 若 MaxGED($q^ $, $k + 1$) 无确定值,则 FADT AVG 无论 $t$ 为何值都返回正确的查询结果。
- 若 $t \geq$ MaxGED($q^ $, $k + 1$),FADT AVG 返回正确的查询结果。
- 若 $0 < t <$ MaxGED($q^*$, $k + 1$),FADT AVG 在终止时返回一个 $t\sqrt{\wp}$ - 近似查询结果,其中 $\wp = k_{out} + 1$。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



