数据仓库项目中数据建模是数据需求到数据落地中间承上启下的一个环节,个人认为非常的重要,它是对需求对的一种提炼,一种总结!逻辑上抽像点来说数据模型是对业务数据按照主题进行组织,它是一个载体;物理上来说它对应的是一系列的维表、事实表。
那么数据仓库项目中数据建模需要着重注意哪些点呢?
1、应该是面向主题建模,而不是面向报表,不应该不断的为了特定的报表大量重复的建模工作。
2、确定数据模式,星型模型还是雪花模型,一般星型模型比较主流,如果业务特点是数据量小,业务却复杂,灵活,可考虑雪花
3、兼顾数据粒度与效率的选择,一般明细的放在仓库层,经过预汇总后的放在集市层,或者脱离DB,为多维立方体组织
4、确定数据分割的策略,是按照行还是按照列组织数据,如果是这多个指标同时不空NULL,可关联性比较高,按照列
5、其他的是考虑分区,索引,表空间等物理相关的策略