2-dw_事实表、维度表

最新推荐文章于 2021-05-12 21:39:55 发布

转载最新推荐文章于 2021-05-12 21:39:55 发布 · 446 阅读

事实表：记录公司的一笔正常的业务数据，需要提供 4W ，什么时候 (When) 在什么地方 (Where) 有哪些人 (Who) 做了什么事 (What) 。为了方便后续分析，在设计事实表的时候，我们应该尽可能的提供详细的维度信息和度量信息。

比如我们在谈一家物流公司的数据仓库的时候，如何去设计落地一个事实表，我们按以下过程来落地。

1 ：用户的目的：首先我们需要知道用户的目的，以价值为导向，解决用户的问题，这时用户会提出，目前公司营运成本太高，今年需要节省多少费用。

2 ：定义指标：针对上面的目标，我们需要与用户一起来分析这个目标，可以用哪些指标来衡量这个目标往预期方向走，也就是我们所说的拆分目标，这个过程会多次沟通，反复的拆分和合并之前定义的指标，比如说最终我们统一认定有装载率、车辆营运公里数、单公斤成本，单公里成本这 4 个指标。

3 ：指标细分：指标确认后，我们就需要细分指标数据 ( 多级指标 ) ，比如装载率这个指标，我们是否需要针对业务场景，区分早、中、晚时段的装载情况，不同车型 (5KG,10KG) 的装载率情况，对于单公斤成本和单公里成本我们是否需要清楚知道成本的费用项，比如司机成本、油费成本、车辆折旧成本等。

4 ：定义相关字段和逻辑：有了以上细分指标的确定，接下来我们只与用户确认各个指标的逻辑和取数口径了，设计好事实表的字段，验证是否满足用户的目的数据应用，假如有如下系统，我们对每个事实表字段确认源系统和后台表字段关系。

a ：车辆调度系统：什么时候哪个车跑了哪条线。

b ：结算系统：每次车的费用是多少。

c ：装载系统：每个车每个线路的业务量信息。

5 ：有了这些指标后我们快速实现和落地，提供一些分析报告，对前端业务做些改进方案，再来验证我们的指标是否往好的方向改变，同时成本也在降低，哪么我们整个方案和指标定义的非常好，如果指标在往好的方向改变，但成本并没有降低，哪么我们就要重新来定义某些指标是否正确了，就这样的一直迭代直到我们达到用户的目标。

维度表：是对事实表里的维度进行扩展更详细的信息补充。我们在定义一个维度表的时候，需要怎样设计呢？比如在事实表里有客户这样的一个维度，我们与用户沟通在他们来看客户这个维度主要关心的是哪些信息，达到什么样的目的，用户一般会想达到用户差异化的管理和销售，哪么我们就要抓住如何来区分客户的差异化的信息：

1 ：基本属性：比如像客户规模（ 1 千人、 1 万人）、地域（深圳、广州等）、行业（制造、互联网等）。

2 ：按客户行为：层级（大客户、散客等）、销售量（ 0-100 ， 101-500 ， 501-1000 等）。