文章目录
简介
随着 IT 时代步入到 DT 时代,从数据中挖掘价值已经变得越来越重要。数据仓库系统长期以来一直是企业 IT 架构的重要组成部分,并且逐步与大数据等技术相融合,已然成为建设数据文化的智慧型企业的必然措施。
本文主要针对数据仓库建设中存在的 workflow 应用场景进行分析,结合数据仓库自身的特性,对现有 workflow 方式进行优化,提出了一套适用于数据仓库建设的 workflow 优化方案。
一、数仓建设
1.数据仓库概念
数据仓库的概念在 1991 年被美国著名的信息工程专家 William Inmon 博士首次提出,它是数据库技术发展到一定阶段的产物。数据仓库是面向主题的、集成的、稳定的和随时间变化的数据集合,是一个数据分析处理过程,而不仅仅是一个数据存储软件或产品。
OLAP ( On-line Analytical Processing,联机分析处理 ) 是数据仓库中最经常使用的数据处理和分析技术,最早由关系数据库之父 E.F.Codd 于 1993 年提出。OLAP 委员会对联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业特性的信息进行快速、一致、交互的存取,从而获得对数据更深入了解的一类软件技术。简单来说,OLAP 就是帮助用户更好的从多个角度去理解现有的数据。
多维模型 ( Multidimensional Model ) 是 OLAP 的数据存储和组织范型,是 OLAP 操作的核心技术。OLAP