关系数据库中多维索引结构的实现
1. 引言
在高维数据空间中进行高效查询处理,是许多数据分析工具的重要需求。像聚类、关联规则挖掘、OLAP 等知识发现任务的算法,常依赖于多维特征空间中的范围搜索或最近邻搜索。由于这些应用要处理大量高维点数据,为实现满意的性能,必须使用多维索引结构进行数据管理。
过去十年,多维索引结构得到了深入研究。多数方法是针对地理信息系统中的二维数据空间设计的,但随着数据维度增加,查询处理性能往往会下降。为解决此问题,出现了两类专门用于高维查询处理的索引结构:
- 多维索引 :直接设计 d 维索引来解决 d 维问题,如 TV - 树、SS - 树、SR - 树和 X - 树。
- 映射技术 :将 d 维问题映射为等价的 1 维问题,利用现有的 1 维索引(如 B + - 树),例如 Z 序、希尔伯特曲线、格雷码和金字塔树。
近年来,人们对将高维点数据集成到商业数据库管理系统的兴趣日益浓厚。虽然关系数据库系统能高效管理标准事务,但在处理高维点数据以支持高级知识发现算法方面表现不佳。常见做法是将生产数据存储在关系数据库中,将分析数据复制到基于文件的多维索引结构中,即混合解决方案。然而,这种方案存在诸多缺点,如数据完整性难以维护、数据安全和备份概念不同、缺乏物理和逻辑数据独立性等。
对象关系数据库系统虽有潜力解决这些问题,但多数商业数据库系统不提供对块管理器的访问,数据插件只能通过 SQL 接口访问关系,因此目前将多维属性存储在数据库内的唯一可行方法是将其映射到关系模型中。
本文提出一种将高维数据空间的专用索引结构概念直接映射到关系模型的技
超级会员免费看
订阅专栏 解锁全文

1384

被折叠的 条评论
为什么被折叠?



