数据仓库、在线分析处理与元数据解析
在商业智能(BI)环境中,数据仓库是核心所在,它是一个集中式的数据存储库,数据来源于多个不同的数据源,可用于驱动分析处理,进而为企业创造价值。接下来,我们将深入探讨数据建模、在线分析处理(OLAP)和元数据管理等方面的内容。
一、业务背景
传统数据库用于业务操作和分析的方式存在显著差异。传统上,数据库围绕事务处理建模,将业务操作转化为操作系统时关注两个要点:
1. 业务需求反映建模实体之间的交互和关系。
2. 每个可识别的业务活动可描述为一系列事务的组合,作为一个虚拟操作来捕捉该活动在模型中的影响。
关系数据库系统的发展是为了适应实体 - 关系模型的事务特性,以简化业务活动。然而,这种框架下的信息表示并不适合分析目的。一方面,数据模型针对事务处理进行了优化,分析性能会受到严重影响;另一方面,数据库分析师对模型的处理方式导致数据布局可能让业务分析师感到困惑。
为了解决这些问题,BI 领域开发了一种更适合驱动分析应用和决策支持的数据模型——维度模型。通过使用这种模型创建集中式数据存储库,并聚合企业各领域的数据集,就可以构建数据仓库,为各个分析应用提供数据。
二、数据模型
数据模型是对现实世界中相互关联的实体集的离散结构化数据表示。随着时间的推移,我们对数据表示方式的理解发生了变化,以适应对信息的理解和处理方式。在操作/战术层面(即“运营业务”)和战略层面(即“改进业务”)使用数据的方式存在显著差异。
2.1 实体 - 关系模型
早期数据库中,数据对象或事务的所有方面(如银行账户或商店采购)可能存储在数据库表的单个条目中,所
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



