数据仓库概念、起源
概念
- 数据仓库(Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。
- 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。
- 数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统;
- 同时数据仓库自身也不需要“消费”任何的数据,其结果开放给各个外部应用使用;
数据仓库的主要特征
- 面向主题:主题是一个抽象的概念,是较高层次上数据综合、归类并进行分析利用的抽象
- 集成性:主题相关的数据通常会分步在多个操作型系统中,彼此分散、独立、异构。需要集成到数仓主题下。
- 非易失性:也叫非易变性。数据仓库是分析数据的平台,而不是创造数据的平台。
- 时变性:数据仓库的数据需要随着时间更新,以适应决策的需要。
OLTP、OLTP区别
概念
- 联机事务处理 OLTP(On-Live Transaction Processing)。
- 联机分析处理 OLAP(On-Live Analytical Processing)。