
Data Warehouse
Larry-Qian
An observer
展开
-
星型模型与雪花模型(Star Schema and Snowflake Schema)
在设计数据仓库模型的时候,最常见的两种是星型模型与雪花模型。选择哪一种需要根据业务需求以及性能的多重考量来定。1.星型模型在星型模型当中,一张事实表被若干张维度表所包围。每一个维度代表了一张表,有主键关联事实表当中的外键。※所有的事实都必须保持同一个粒度※不同的维度之间没有任何关联2.雪花模型雪花模型是在基于星型模型之上拓展来的,每一个维度可以再原创 2015-07-09 16:18:45 · 15174 阅读 · 0 评论 -
Compare IBM Datastage, Informatica and Microsoft SSIS
1) System PlfatformDataStage: Windows, Unix, Other PlatformsInformatica: Windows, UnixMicrosoft SSIS: Windows2) ParallelismDataStage: Have both sequence (DataStage Server) and paralle转载 2015-07-09 16:29:09 · 975 阅读 · 0 评论 -
理解缓慢变化维(Slowly Changing Dimension)
“缓慢变化维度”是在构建数据仓库时比较常见的一种情况。简而言之它适用于这种情况——数据记录会随着时间而发生变化。举个例子:Larry是S公司的一个职员。他居住在上海,于是查找用户表有以下记录:Record IDNameLocate1001LarryShanghai在一段时间以后,Larry被派遣到了北京的分原创 2015-07-09 00:13:54 · 2334 阅读 · 0 评论 -
两种数据仓库建构理论Bill Inmon vs. Ralph Kimball
在数据仓库领域,我们经常听到一些个人或者组织关于数据仓库理论的争论,到底是归属Bill Inmon一派还是Ralph Kimball一派。下面我们将会描述这两者的区别。Bill Inmon范式:数据仓库是一个整体的商业智能系统的一部分。一家企业只有一个数据仓库,数据集市的信息来源出自数据仓库。在数据仓库中,信息存储符合第三范式。Ralph Kimball范式:数据仓库是企业翻译 2015-07-21 22:37:36 · 5447 阅读 · 0 评论