云端多维数组数据仓库的高效解决方案
1. 多维数据分析与云数据管理基础
1.1 OLAP 操作与 MOLAP 系统
在数据分析领域,OLAP(联机分析处理)操作是决策制定者进行数据探索的重要工具。像上卷(roll - up)和下钻(drill - down)这类 OLAP 运算符,能让决策者借助 SQL 聚合函数在数据层次结构中导航并聚合数据。此外,还有一些运算符用于选取数据仓库的部分数据以及对维度进行置换。
MOLAP(多维联机分析处理)系统采用多维数据结构,如基于原始数据构建的多维数组,这些原始数据通常存储在关系数据库中。MOLAP 系统通过其独特的存储数据模型,提升了密集型数据仓库的存储性能。因为使用多维数组时,只需存储度量值,它们通过维度成员的位置进行索引。
例如,在一个 MOLAP 表示中,位置 ARRAY[2][1] 的度量值与第一个维度的第二个成员(如 2000 - 01 - 02)和第二个维度的第一个成员(如 Allier 部门)相关联。同时,为了存储一维数组,有一个简单公式:设维度为 d,第 k 个维度的成员数为 Nk,那么度量值在一维数组中的位置 p(i1, …, id) = ∑(j = 1 到 d)(ij * ∏(k = j + 1 到 d)Nk),其中 ij 是第 j 个维度成员的位置。
1.2 云数据管理架构
随着数据量的爆炸式增长,传统的关系型或对象型数据库管理系统已难以满足需求。例如,Facebook 每天要管理数亿用户、数十亿张上传图片和数百万个新增事件。为此,云环境下发展出了新的数据管理架构,通常采用分层架构:
- 基础设施层 :一
超级会员免费看
订阅专栏 解锁全文
4975

被折叠的 条评论
为什么被折叠?



