维度建模培训随笔

最新推荐文章于 2025-09-19 18:09:37 发布

转载最新推荐文章于 2025-09-19 18:09:37 发布 · 95 阅读

·

0

·

数据仓库是从大的数据中获取一些宏观指标，为决策提供支持
报表，一个报表的作用是确定后期的工作，明白事，分析事，
数据仓库是对系统建设的一种推动，可以发现原系统问题，规范各系统之间的数据定义及内容。
举例：
维度冗余，体系要一致，
原始底层维度就冗余，而很多地方新生成的数据是根据维度表间关系连接而得到，这样，可能造成
数据入口不同而数据不一致，分析具体原因，数据仓库项目中，尽量确定统一入口进行统计。
数据仓库内部一致性，发现问题，分析问题，
数据编码尽量用户不可见。
从自身角度、个人所经历项目或目前所做的事情，认真分析概念内容。
认真分析系统中所涉及的维度表，确定其的组织形式、是否需要缓慢变化、层次、数据来源等内容。掌控数据。

重要：--事实表，表示维度多对多的关系。如果是多对一，则可以维度抽取出于另一维度中
忌讳：
套概念，

尽量不做更新操作，因为要考虑回退操作，很难实现
尽量采用流水的加减实现数据的统计
举例：
1，维度指标设计，如一些标准值

建模尽量抛开业务，如游戏种类和游戏，单一主键

维度过多，合种相关的维度进行抽像提出，事实表中只包含最细粒度维度，
注意：如两者之间虽然有联系，但随时会发生变化，可考虑事实表冗余此维度。 77页

代理关键字考虑，避免字段带有技巧性内容，，，为什么，因为今天业务如此是技巧，明天就是垃圾

把一些非累加半累加转换成全累加型模型，（重要）
把一些多事务事实表，转化为单事务事实表。

周期快照,考验，每天一个余量，，比如，三月份公司员工有多少人，应该是一个时间点的人数，银行存款，，==
举例：录像，每帧为一个周期快照

业务环节的记录，事务快照，多数为更新，，

-----最后，数据仓库总线介绍，，矩阵法
维度的一致性，，维度成员都是单独的，不存在相交情况

缓慢变化，对应几种情况
快速变化，采用维度追加于事实表中

数据难处理的是活跃的数据，分析活跃数据的生命周期，制定相应数据存储

--------------开篇：
先说一些常见的数据统计，单时间，跨时间（多业务环节）

事实表拆分考虑，统计维度是互折的，业务中不可能同时查询此两维度，

为每个业务主题保留最细粒度的维度模型

---------------
避免维度表中的主键有内在的含义
操作型系统中的产品键都是有内在含义的
不要用生产系统中的键作为维度表的主键 --不同意思，需要特定的转换，麻烦
反映历史时，同一键可能对应不同的实体

-----------------------------------------------------

个人一些建议：

对于底层事实表尽量使用事务事实表（少用更新操作)
避免字段技巧性设计
围绕业务流程构建维度模型
对于事实表中度量尽量考虑可全累加设计
事实表中代理主键的慎用
保证数据入口的一致性
事实表中尽量有且仅有单一的时间维
缓慢变化维及事实表冗余的设计权衡
事实规范化(把事实表中保留单个度量)慎用
维度建模理论体系较大，择其合适使用之

数据仓库采用使用维度建模的好处：易理解、查询的高性能、修改的灵活性和可扩充性。

维度建模是一个可不断扩充添加的过程

（1）、在现有的事实表中增加维度。

（2）、在事实表中增加事实。

（3）、在维度表中增加属性。

在比较了解业务情况下，可先以底层细粒度构建开始，反之，以业务需求的粗粒度开始，至顶向下

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/134308/viewspace-761167/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/134308/viewspace-761167/

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。