在上一篇中讲到了数据仓库的使用业务场景与数据仓库中相关的一些概念,本篇讲述的是如何实现数据仓库的分析篇

 

        从全局里讲要实现数据仓库,无非有两种模式:

        (1)自顶向下的方式,先从全局出发,进行分析建立全局的数据仓库,在分别建立各个部分的数据集市

        (2)自底向上的方式,先从部门开始建立数据集市,再按照此部门为基准,建立其他部门的数据集市。这个基准指的是统一的维与业务事实

 

3、多维数据模型

      3.1)多维数据模型是数据仓库普遍采用的数据建模方法。多维数据模型以直观的方式组织数据,并支持高性能的数据访问。

      每一个多维数据模型由多个多维数据模式(Dimensional Data Schema)表示,每一个多维数据模式都是由一个事实表和一组维表组成的。事实表的主码是组合码,维表的主码是简单码,每一张为表中的简单码与事实表组合码中的一个组成部分相对应。如:

110118956.jpg

    优势

    (1)多维数据模型是已知标准化的结构,即包含多个多维数据模式,每一个多维数据模式多对应一张事实表和多张维表,这样的标准化数据结构为系统前端工具的设计提供了规范且优越的基础

    (2)多维数据模型具有已知的多维结构,能够支持最终用户不可预知的操作

    (3)对决策分析有很好的扩展性

    3.2)星形模式

        多维数据模型通常采用的一种重要的模式:星形模式

113035826.jpg

        (1)结构简单,表的数目比较少,建模比较方便,并且星型模式符合人们的思维方式,易于决策分析人员理解和使用。

        (2)数据仓库采用多维数据模型,星型模式支持这种多维数据建模,支持使用人员从不同的维度对数据进行分析。

        (3)星型模式能较好地为数据仓库提供查询支持

        (4)星形模式可以提高查询的速度

125212686.jpg

125317193.jpg

125057798.jpg

125632812.jpg

125749181.jpg