数据仓库与OLAP技术概述
1. 数据仓库与操作型数据库分离的原因
操作型数据库主要用于日常事务处理,其查询通常较为简单。而数据仓库的查询往往很复杂,涉及对大量数据在汇总层面的计算,可能需要基于多维视图的特殊数据组织、访问和实现方法。在操作型数据库中处理OLAP查询会显著降低操作任务的性能。
操作型数据库支持多个事务的并发处理,需要并发控制和恢复机制(如锁定和日志记录)来确保事务的一致性和健壮性。而OLAP查询通常只需要对数据记录进行只读访问以进行汇总和聚合。如果对OLAP操作应用并发控制和恢复机制,可能会影响并发事务的执行,从而大幅降低OLTP系统的吞吐量。
此外,决策支持需要历史数据,而操作型数据库通常不维护历史数据。操作型数据库中的数据虽然丰富,但对于决策来说往往不够完整。决策支持需要对来自异构源的数据进行整合(如聚合和汇总),以获得高质量、干净且集成的数据。相比之下,操作型数据库只包含详细的原始数据,如交易记录,在分析之前需要进行整合。
不过,许多操作型关系数据库管理系统的供应商开始优化其系统以支持OLAP查询。随着这一趋势的持续,OLTP和OLAP系统之间的分离预计会减少。
2. 多维数据模型
2.1 从表和电子表格到数据立方体
数据立方体允许数据在多个维度上进行建模和查看,它由维度和事实定义。维度是组织希望记录信息的视角或实体。例如,AllElectronics可能会创建一个销售数据仓库,以记录商店在时间、商品、分店和地点等维度上的销售情况。每个维度可能有一个关联的维度表,用于进一步描述该维度。
事实是数值度量,例如销售数据仓库中的销售金额、销售数量和预算金额等
数据仓库与OLAP技术及多维数据模型解析
超级会员免费看
订阅专栏 解锁全文
455

被折叠的 条评论
为什么被折叠?



