前言
笔者在工作刚接触这部分知识的时候,翻阅了各种文档想要到一个比较通俗的理解数据仓库相关的介绍或是理解。之前只是在工作涉及数仓这块的一些业务,理论上有一定的缺失,所以最近准备刷一刷《数据仓库工具箱》这本书,顺便就将读完的一些理解和知识点在简书这边记录下来,算是对自己未来学习计划的一个鼓励和督促。
笔者是个渣渣,如有理解上的错误或者偏差,希望大家指点出来,互相学习讨论。
本文的目的主要是介绍数据仓库等一些概念或者是一些理解,所以涉及到一些资料,就直接附链接了。。
数据仓库和商业智能
基本概念的初步了解
在计算机领域,数据仓库(英语:data warehouse,也称为企业数据仓库)是用于报告和数据分析的系统,被认为是商业智能的核心组件。[1] 数据仓库是来自一个或多个不同源的集成数据的中央存储库。数据仓库将当前和历史数据存储在一起[2],用于为整个企业的员工创建分析报告。[3]
存储在仓库中的数据从运行系统(例如营销或销售)上传。这些数据可能会通过一个ODS数据库,并且可能需要进行额外操作的数据清理[2],以确保