公司的数据都有一定的复杂性,处理时很容易被其影响,只有总结并掌握一个好的设计原则,才能应对纷繁复杂的业务细节。
先总结一下数据仓库工具箱中的提到的维度建模的4步过程
第一步:选择业务过程
业务过程的公共特征:
1)业务过程通常表示业务执行的活动,用行为动词表示
2)业务过程通常由某一操作型系统来支撑,如订单管理系统
3)业务过程的结果通常是建立并获得某些关键度量数据
4)业务过程包含输入及输出,由输入激活
一系列的业务过程产生一系列的事实表,通过对产生的数据进行分析,能够得出一些利于管理者为提升竞争优势而制定决策的结论。所以,想要得到一个好的设计模型,需要深入挖掘和理解数据及对应操作型系统,一方面不能被数据复杂性蒙蔽,另一方面也不能不加思索,草草了事。
第二步:确定粒度
确定粒度即精确定义事实表中的每一行表示什么,它表示的是与事实表度量有关的细节级别。在理解上可以认为粒度与主键等价。但是在进行维度模型设计时,应该使用业务术语来表示粒度。
第三步:确定维度
维度用于描述业务过程事件的度量数据。比如说,从某个维度(日期)上来看,这条事件记录(日期数据)反常,应该重点关注。常见的维度实例包括日期、产品、市场、客户、雇员、设备等。通常用于表示"WHO WHAT WHERE WHEN WHY HOW"关联的事件。
在确定维度的过程中,还是应该以满足指导业务规划决策的需求为原则,必须保证维度数据能够说明问题。
第四步:确定事实