高效多维AkNN查询处理:云端解决方案深度剖析
1. 核心概念定义
在深入探讨高效多维AkNN查询处理之前,我们需要明确一些关键的概念和符号,这些是后续理解和实现算法的基础。以下是一些重要符号及其含义:
| 符号 | 含义 |
| ---- | ---- |
| n | 空间分解的粒度 |
| k | 最近邻的数量 |
| d | 维度 |
| D | d维度量空间 |
| dist(r, s) | 点r到点s的距离 |
| kNN(r, S) | 从数据集S中选取的点r的k个最近邻 |
| AkNN(R, S) | 数据集R中所有点相对于数据集S的k个最近邻 |
| AkNNC(R, S) | 基于kNN对数据集R中的点进行分类 |
| I | 输入数据集 |
| T | 训练数据集 |
| cr | 点r的类别 |
| CT | 训练数据集T的类别集合 |
| SI | 输入数据集的大小 |
| ST | 训练数据集的大小 |
| M | Map任务的总数 |
| R | Reduce任务的总数 |
同时,我们还定义了一些重要的概念:
- kNN :给定一个点r、一个数据集S和一个整数k,kNN(r, S)是从S中选取的k个点的集合,使得对于集合中的任意点p和不在集合中的任意点q,都有dist(p, r) < dist(q, r)。
- AkNN :给定两个数据集R和S以及一个整数k,AkNN(R, S)是一组对(r,
超级会员免费看
订阅专栏 解锁全文
1167

被折叠的 条评论
为什么被折叠?



