高效多维 AkNN 查询处理与多查询计划生成的研究
在数据处理和数据库领域,高效的查询处理和合理的物理设计至关重要。本文将围绕多维 AkNN 查询处理以及多查询计划生成的相关研究展开,介绍实验评估、性能影响因素等内容,并探讨多查询优化与物理设计之间的联系及解决方案。
多维 AkNN 查询处理实验评估
- 实验环境搭建
- 集群配置 :使用包含 32 个计算节点(VMs)的集群,每个节点配备四个 2.1 GHz CPU 处理器、4 GB 内存、40 GB 硬盘,节点通过 1 千兆以太网连接。
- 软件安装 :在每个节点上安装 Ubuntu 12.04 操作系统、Java 1.7.0 40(64 位服务器 VM)和 Hadoop 1.0.4。
- Hadoop 配置调整 :将复制因子设置为 1;每个节点的最大 Map 和 Reduce 任务数设置为 3;DFS 块大小设置为 256 MB;每个 Map 和 Reduce 任务的虚拟内存大小设置为 512 MB。
- 数据集准备
- 数据集类型 :使用真实数据集和合成数据集。从真实数据集中分别提取 x 坐标和 (x, y) 坐标创建 1D 和 2D 数据集,经过处理(归一化)后得到 1D、2D 和 3D 数据集,约包含 19,000,000 个点,遵循幂律分布。同时创建包含
超级会员免费看
订阅专栏 解锁全文
850

被折叠的 条评论
为什么被折叠?



