数据的组织形式是按主题域而不是按功能需要。
2
)数据是整合的数据,而不是
“
孤立
”
的烟囱数据。
3
)数据是随时间变化的系列数据,而非仅当前时间的值。
4
)数据在数据仓库中的延迟比在应用程序中高。
5
)数据仓库中提供的历史数据比应用程序中提供的历史数据多。
6.
多维数据仓库(
Kimball
)
Kimball
的多维数据仓库是数据仓库开发的另一个主要模式。
Kimball
将数据仓库简单地定义为
“
专为查询和分析而构建的事务数据的
副本
”
(
Kimball
,
2002
)。但是,
“
副本
”
的说法并不精确。仓库数据存
储在多维数据模型中。多维模型旨在方便数据使用者理解和使用数据,
同时还支持更优的查询性能
[3]
。它不是以实体关系模型的规范化要求组
织的。
多维模型通常称为星型模型,由事实表(包含有关业务流程的定量
数据,如销售数据)和维度表(存储与事实表数据相关的描述性属性,
为数据消费者解答关于事实表的问题,如这个季度产品
X
卖了多少)组
成。事实表与许多维表关联,整个图看上去像星星一样(参见第
5
章)。多个事实数据表将通过
“
总线
”
共享公共的维度或遵循一致性的维
度,类似于计算机中的总线
[4]
。通过插入遵循维度的总线,可以将多个
数据集市集成为企业级的数据集市。
数据仓库的总线矩阵展示的是生成事实数据的业务流程和表示维度
的数据主题域的交汇。当多个流程使用相同的数据时,存在遵循维度的
机会。表
11-1
是一个总线矩阵的例子。在这个例子中,销售、库存和订
单的业务流程都需要日期和产品数据。销售和库存都需要商店数据,而
库存和订单需要供应商数据。日期、产品、商店和供应商都是遵循维度
的候选项。相对而言,仓库数据不共享(不遵循维度),仅供库存使
用。
表
11-1
数据仓库总线矩阵示例
企业数据仓库总线矩阵独立于技术,可用于表示数据仓库
/
商务智
能系统长期数据的内容需求。这个工具可以帮助组织确定可管理的开发
工作范围。每一个新的实现都构成整体架构的增量部分。在某种程度
上,存在足够多的维度模式,以兑现实现集成企业数据仓库环境的承
诺。
图
11-3
表示
Kimball
的数据仓库
/
商务智能架构的数据工厂棋子视
图。请注意,
Kimball
的数据仓库比
Inmon
的数据仓库的可扩展性更强。
数据仓库包含数据暂存和数据展示区域的所有组件。
1
)业务源系统。企业中的操作型
/
交易型应用程序。这些应用程序
产生数据,数据再被集成到操作型数据存储和数据仓库中。此组件等同
于企业信息工厂图中的应用程序系统。
2
)数据暂存区域。
Kimball
的暂存区域包括需要集成的流程和用于
展示的转换数据,可以与企业信息工厂的集成、转换和数据仓库组件的
组合进行类比。
Kimball
的重点是分析类数据的高效终端交付,比
Inmon
的企业管理数据范围要小。
Kimball
的企业数据仓库可以适配数据暂存
区域架构。
3
)数据展示区域。与企业信息工厂中的数据集市类似,关键的架
构差异在于
“
数据仓库总线
”
的集成范式,如应用于若干个数据集市的共
享或一致的维度