企业数据仓库总线矩阵独立于技术,可用于表示数据仓库
/
商务智
能系统长期数据的内容需求。这个工具可以帮助组织确定可管理的开发
工作范围。每一个新的实现都构成整体架构的增量部分。在某种程度
上,存在足够多的维度模式,以兑现实现集成企业数据仓库环境的承
诺。
图
11-3
表示
Kimball
的数据仓库
/
商务智能架构的数据工厂棋子视
图。请注意,
Kimball
的数据仓库比
Inmon
的数据仓库的可扩展性更强。
数据仓库包含数据暂存和数据展示区域的所有组件。
1
)业务源系统。企业中的操作型
/
交易型应用程序。这些应用程序
产生数据,数据再被集成到操作型数据存储和数据仓库中。此组件等同
于企业信息工厂图中的应用程序系统。
2
)数据暂存区域。
Kimball
的暂存区域包括需要集成的流程和用于
展示的转换数据,可以与企业信息工厂的集成、转换和数据仓库组件的
组合进行类比。
Kimball
的重点是分析类数据的高效终端交付,比
Inmon
的企业管理数据范围要小。
Kimball
的企业数据仓库可以适配数据暂存
区域架构。
3
)数据展示区域。与企业信息工厂中的数据集市类似,关键的架
构差异在于
“
数据仓库总线
”
的集成范式,如应用于若干个数据集市的共
享或一致的维度。
4
)数据访问工具。
Kimball
方法侧重于最终用户的数据需求。这些
需求推动采用适当的数据访问工具。
图
11-3 Kimball
的数据仓库棋子视图
[5]
7.
数据仓库架构组件
数据仓库环境包括一系列组织起来以满足企业需求的架构组件。图
11-4
描述了本节讨论的数据仓库
/
商务智能和大数据环境的架构组件。大
数据的发展为数据流入企业增加了一个新的途径,因而改变了数据仓
库
/
商务智能的格局。
图
11-4
还描述了数据生命周期的各个方面。从源系统流动到数据暂
存区,数据可以在这里被清洗,当数据集成并存储在数据仓库或操作数
存储中时,可以对其进行补充丰富。在数据仓库中,可以通过数据集市
或数据立方体访问数据,生成各种各样的报表。大数据经历了一个类似
的过程,但有一个显著的区别:虽然大多数仓库在将数据放入表之前进
行数据整合,但大数据解决方案会在整合数据之前先将数据加载进来。
大数据的商务智能除了各种传统类型的报表之外,还可能包括预测分析
和数据挖掘(参见第
14
章)。
(
1
)源系统
图
11-4
左侧的源系统包括要流入数据仓库
/
商务智能环境的业务系统
和外部数据。它们通常包括如客户关系管理系统、账务系统和人力资源
系统等业务系统,以及与特定行业相关的一些业务系统。来自供应商和
外部来源的数据也可能包括
DaaS
服务(数据即服务,
Data
As
a
Service
)、网页内容和任何大数据计算结果。
(
2
)数据集成
数据集成包括抽取、转换和加载(此三者英文首字母缩写为
E
、
T
、
L
,通常直接这把三者称为
ETL
)、数据虚拟化以及将数据转换为通
用格式和位置的其他技术。在
SOA
环境中,数据服务层是该组件的组成
部分之一。在图
11-4
中,用箭头表示数据集成流程(参见第
8
章)。