数据仓库是从大的数据中获取一些宏观指标,为决策提供支持
报表,一个报表的作用是确定后期的工作, 明白事,分析事,
数据仓库是对系统建设的一种推动,可以发现原系统问题,规范各系统之间的数据定义及内容。
举例:
维度冗余,体系要一致,
原始底层维度就冗余,而很多地方新生成的数据是根据维度表间关系连接而得到,这样,可能造成
数据入口不同而数据不一致, 分析具体原因,数据仓库项目中,尽量确定统一入口进行统计。
数据仓库内部一致性,发现问题,分析问题,
数据编码尽量用户不可见。
从自身角度、个人所经历项目或目前所做的事情,认真分析概念内容。
认真分析系统中所涉及的维度表,确定其的组织形式、是否需要缓慢变化、层次、数据来源等内容。掌控数据。
报表,一个报表的作用是确定后期的工作, 明白事,分析事,
数据仓库是对系统建设的一种推动,可以发现原系统问题,规范各系统之间的数据定义及内容。
举例:
维度冗余,体系要一致,
原始底层维度就冗余,而很多地方新生成的数据是根据维度表间关系连接而得到,这样,可能造成
数据入口不同而数据不一致, 分析具体原因,数据仓库项目中,尽量确定统一入口进行统计。
数据仓库内部一致性,发现问题,分析问题,
数据编码尽量用户不可见。
从自身角度、个人所经历项目或目前所做的事情,认真分析概念内容。
认真分析系统中所涉及的维度表,确定其的组织形式、是否需要缓慢变化、层次、数据来源等内容。掌控数据。
重要:--事实表,表示维度多对多的关系。如果是多对一,则可以维度抽取出于另一维度中
忌讳:
套概念,
忌讳:
套概念,
尽量不做更新操作,因为要考虑回退操作,很难实现
尽量采用流水的加减实现数据的统计
举例:
1,维度指标设计,如 一些标准值
尽量采用流水的加减实现数据的统计
举例:
1,维度指标设计,如 一些标准值
建模尽量抛开业务,如 游戏种类和游戏,单一主键
维度过多,合种相关的维度进行抽像提出,事实表中只包含最细粒度维度,
注意:如两者之间虽然有联系,但随时会发生变化,可考虑事实表冗余此维度。 77页
代理关键字考虑 ,避免字段带有技巧性内容,,,为什么, 因为今天业务如此是技巧,明天就是垃圾
把一些非累加半累加转换成全累加型模型,(重要)
把一些多事务事实表,转化为单事务事实表。
把一些多事务事实表,转化为单事务事实表。
周期快照,考验,每天一个余量 ,,比如,三月份公司员工有多少人,应该是一个时间点的人数,银行存款,,==
举例:录像,每帧为一个周期快照
举例:录像,每帧为一个周期快照
业务环节的记录,事务快照,多数为更新,,
-----最后,数据仓库总线介绍,,矩阵法
维度的一致性,,维度成员都是单独的,不存在相交情况
维度的一致性,,维度成员都是单独的,不存在相交情况
缓慢变化,对应几种情况
快速变化,采用维度追加于事实表中
快速变化,采用维度追加于事实表中
数据难处理的是活跃的数据,分析活跃数据的生命周期,制定相应数据存储
--------------开篇:
先说一些常见的数据统计,单时间,跨时间(多业务环节)
先说一些常见的数据统计,单时间,跨时间(多业务环节)
事实表拆分考虑,统计维度是互折的,业务中不可能同时查询此两维度,
为每个业务主题保留最细粒度的维度模型
---------------
避免维度表中的主键有内在的含义
操作型系统中的产品键都是有内在含义的
不要用生产系统中的键作为维度表的主键 --不同意思,需要特定的转换,麻烦
反映历史时,同一键可能对应不同的实体
避免维度表中的主键有内在的含义
操作型系统中的产品键都是有内在含义的
不要用生产系统中的键作为维度表的主键 --不同意思,需要特定的转换,麻烦
反映历史时,同一键可能对应不同的实体
-----------------------------------------------------
个人一些建议:
对于底层事实表尽量使用事务事实表(少用更新操作)
避免字段技巧性设计
围绕业务流程构建维度模型
对于事实表中度量尽量考虑可全累加设计
事实表中代理主键的慎用
保证数据入口的一致性
事实表中尽量有且仅有单一的时间维
缓慢变化维及事实表冗余的设计权衡
事实规范化(把事实表中保留单个度量)慎用
维度建模理论体系较大,择其合适使用之
避免字段技巧性设计
围绕业务流程构建维度模型
对于事实表中度量尽量考虑可全累加设计
事实表中代理主键的慎用
保证数据入口的一致性
事实表中尽量有且仅有单一的时间维
缓慢变化维及事实表冗余的设计权衡
事实规范化(把事实表中保留单个度量)慎用
维度建模理论体系较大,择其合适使用之
数据仓库采用使用维度建模的好处:易理解、查询的高性能、修改的灵活性和可扩充性。
维度建模是一个可不断扩充添加的过程
(1)、在现有的事实表中增加维度。
(2)、在事实表中增加事实。
(3)、在维度表中增加属性。
在比较了解业务情况下,可先以底层细粒度构建开始,反之,以业务需求的粗粒度开始,至顶向下
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/134308/viewspace-761167/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/134308/viewspace-761167/
527

被折叠的 条评论
为什么被折叠?



