什么是数据仓库
- 数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合,用于支持经营管理决策制定过程。
- 数据仓库技术包括数据清理、数据集成和联机分析处理
操作型数据与分析型数据的区别
操作型数据 | 分析型数据 |
细节的 | 综合的,或提炼的 |
在存取瞬间是准确的 | 代表过去的数据 |
可更新 | 不更新 |
操作需求事先可知道 | 操作需求事先不可知 |
生命周期符合SDLC | 完全不同的生命周期 |
对性能要求高 | 对性能要求宽松 |
一个时刻操作一个单元 | 一时刻操作一个集合 |
事务驱动 | 分析驱动 |
面向应用 | 面向分析 |
一次操作数据量小 | 一次操作数据量大 |
支持日常操作 | 支持管理操作 |
数据库与数据仓库的处理环境对比:
数据库 | 数据仓库 |
面向应用 | 面向主题 |
数据是详细的 | 数据是综合的或提炼的 |
保持当前数据 | 保存过去和现在的数据 |
数据是可更新的 | 数据不可更新 |
对数据操作是重复的 | 对数据操作是启发式的 |
操作需求事先可知 | 操作需求是临时决定的 |
数据非冗余 | 数据常冗余 |
操作频繁 | 操作相对不频繁 |
鲜有复杂的计算 | 需作复杂的计算 |
支持事务处理 | 支持决策处理 |
什么是联机分析处理(OLAP)
- 决策分析需要对多个关系数据库共同进行大量的综合计算才能得到结果。
- 关系数据库是二维数据(平面),多维数据库的空间立体数据。
- OLAP的基本思想是要从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化