数据仓库与可通过Web访问的数据库:概念、架构与技术
数据仓库处理要求与规则
数据仓库在处理需求上与联机事务处理(OLTP)系统和运营数据库有很大不同:
1. 工作负载 :数据仓库旨在适应即席查询,其工作负载可能无法提前预知,因此需针对各种可能的查询操作进行优化。而OLTP系统和运营数据库仅支持预定义操作。
2. 数据修改 :数据仓库通过ETL(提取、转换、加载)过程定期更新,通常是每晚或每周进行批量数据修改,终端用户不直接更新数据仓库。相比之下,OLTP系统和运营数据库中,终端用户会常规地向数据库发出单个数据修改语句,OLTP数据库始终保持最新状态,反映每个业务交易的当前状态。
3. 模式设计 :数据仓库常使用非规范化或部分规范化的模式(如星型模式)来优化查询性能。星型模式中有一个“中心”表,即事实表,其他维度表通过1:M关系与事实表相关联。而OLTP系统和运营数据库通常使用完全规范化的模式,以优化更新、插入和删除操作的性能,并保证数据一致性。
4. 典型操作 :典型的数据仓库查询可能会扫描数千或数百万行数据,例如确定特定时间段内所有客户的总销售额。而除了复杂查询外,典型的OLTP或运营数据库操作仅访问存储数据的一小部分,如从存储数十万条采购订单的表中检索特定客户的当前采购订单。
William Inmon在20世纪90年代首次引入数据仓库,并提出了管理数据仓库的十二条规则:
1. 分离 :数据仓库和运营数据库环境应分离。
2. 集成
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



