===重要章节(1、2、4、18、19、20、21)
1.数据治理
1.1数仓基本概念
- 元数据
-纬度表
描述具体事物信息的记录,例如物品、人员信息、商品信息等
-事实表
生产、活动产生的记录信息,例如购物记录、旅行记录等(通过外键关联纬度表)
-事实表与纬度表区别
可以通过分析该列是否是一种包含多了个值并且作为计算的参与者的度量,这种为事实;或菏泽该列是对具体指的描述,
是一个常量、某一约束和行标示的参与者,此时属性往往是纬度属性。
三种常见的数仓模型
雪花(划分更详细、占用存储)、星型(相较于雪花更常见)、星座模型(事实表共享维表)
数据仓库设计考虑的视图(数据挖掘:概念与技术)
- 自顶向下试图:选择数据仓库所需的相关信息
- 数据源视图:解释被操作数据库系统手机、存储和管理的信息
- 数据仓库视图:事实表和维表