据的组织形式是按主题域而不是按功能需要

文章讨论了数据仓库的设计原则,包括按主题域组织数据、整合的非孤立数据、随时间变化的系列数据。重点介绍了Kimball的多维数据仓库模型,这种模型以星型结构由事实表和维度表组成,支持高效查询和分析。数据仓库的总线矩阵用于展示业务流程和数据主题域的交汇,促进数据集成。此外,文章提到了数据暂存区域和数据展示区域在Kimball架构中的角色,强调其对分析类数据的高效处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据的组织形式是按主题域而不是按功能需要。
2 )数据是整合的数据,而不是 孤立 的烟囱数据。
3 )数据是随时间变化的系列数据,而非仅当前时间的值。
4 )数据在数据仓库中的延迟比在应用程序中高。
5 )数据仓库中提供的历史数据比应用程序中提供的历史数据多。
6. 多维数据仓库(
Kimball
Kimball 的多维数据仓库是数据仓库开发的另一个主要模式。
Kimball 将数据仓库简单地定义为 专为查询和分析而构建的事务数据的
副本 Kimball 2002 )。但是, 副本 的说法并不精确。仓库数据存
储在多维数据模型中。多维模型旨在方便数据使用者理解和使用数据,
同时还支持更优的查询性能 [3] 。它不是以实体关系模型的规范化要求组
织的。
多维模型通常称为星型模型,由事实表(包含有关业务流程的定量
数据,如销售数据)和维度表(存储与事实表数据相关的描述性属性,
为数据消费者解答关于事实表的问题,如这个季度产品 X 卖了多少)组
成。事实表与许多维表关联,整个图看上去像星星一样(参见第 5
章)。多个事实数据表将通过 总线 共享公共的维度或遵循一致性的维
度,类似于计算机中的总线 [4] 。通过插入遵循维度的总线,可以将多个
数据集市集成为企业级的数据集市。
数据仓库的总线矩阵展示的是生成事实数据的业务流程和表示维度
的数据主题域的交汇。当多个流程使用相同的数据时,存在遵循维度的
机会。表 11-1 是一个总线矩阵的例子。在这个例子中,销售、库存和订
单的业务流程都需要日期和产品数据。销售和库存都需要商店数据,而
库存和订单需要供应商数据。日期、产品、商店和供应商都是遵循维度
的候选项。相对而言,仓库数据不共享(不遵循维度),仅供库存使
用。
11-1 数据仓库总线矩阵示例 企业数据仓库总线矩阵独立于技术,可用于表示数据仓库 / 商务智
能系统长期数据的内容需求。这个工具可以帮助组织确定可管理的开发
工作范围。每一个新的实现都构成整体架构的增量部分。在某种程度
上,存在足够多的维度模式,以兑现实现集成企业数据仓库环境的承
诺。
11-3 表示 Kimball 的数据仓库 / 商务智能架构的数据工厂棋子视
图。请注意, Kimball 的数据仓库比 Inmon 的数据仓库的可扩展性更强。
数据仓库包含数据暂存和数据展示区域的所有组件。
1 )业务源系统。企业中的操作型 / 交易型应用程序。这些应用程序
产生数据,数据再被集成到操作型数据存储和数据仓库中。此组件等同
于企业信息工厂图中的应用程序系统。
2 )数据暂存区域。 Kimball 的暂存区域包括需要集成的流程和用于
展示的转换数据,可以与企业信息工厂的集成、转换和数据仓库组件的
组合进行类比。 Kimball 的重点是分析类数据的高效终端交付,比 Inmon
的企业管理数据范围要小。 Kimball 的企业数据仓库可以适配数据暂存
区域架构。
3 )数据展示区域。与企业信息工厂中的数据集市类似,关键的架
构差异在于 数据仓库总线 的集成范式,如应用于若干个数据集市的共
享或一致的维度
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

手把手教你学AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值