
数据仓库
南山行者
这个作者很懒,什么都没留下…
展开
-
数据仓库分层
数据仓库的分层可以算是数据仓库架构的子话题。在前段时间参与的一次讨论中,笔者发现其中争论的焦点集中在每一层的作用、特点、是否有必要存在等问题。其中,大家虽然一致提到某些相关概念,但各方的理解却并非完全一致。例如对于ODS是什么、维度建模是什么等问题的解读,都是如此。 不妨想想看:数据从分散而异构的数据源中长途跋涉,到最终的报表、仪表盘、OLAP应用等等,让用户看到一致的结果,这是一个过程。记得以转载 2016-03-31 16:52:40 · 2661 阅读 · 1 评论 -
维度建模的基本概念及过程
0 引言 与流行的说法不同,RalphKimball本人并没有定义“维度”和“事实”这样的术语。术语“维度”与“事实”,最初是20世纪60年代在一个由GeneralMills与Dartmouth大学主持的联合研究计划中提出的。70年代,ACNielsen和IRI都一致地使用这些术语描述他们的数据发布应用,用现在更为准确的话来说,就是关于零售数据的维度数据集市(DataMart)。在简明性成为生活转载 2016-03-31 16:50:22 · 1861 阅读 · 0 评论 -
Greenplum数据仓库简介
Greenplum做为新一代的数据库引擎,有着良好的发展与应用前景。强大的工作效率,低成本的硬件平台对数据仓库与商业智能建设有很大的吸引力。要清楚的了解其特点最好从架构着手。 架构分析 Greenplum的高性能得益于其良好的体系结构。Greenplum的架构采用了MPP(大规模并行处理)。在 MPP 系统中,每个 SMP 节点也可以运行自己的操作系统、数据库等。换言之,每个节点内的 CPU转载 2015-12-10 12:03:23 · 4183 阅读 · 0 评论 -
数据仓库之ETL应用
ETL是什么? ETL即数据抽取(Extract)、转换(Transform)、装载(Load)的过程,在数据仓库建置过程中,资料整合转换(ETL)是最花费时间、人力的,约占整个项目的60%-70%左右。一家企业除了在不同的成长阶段所留下来历史资料,还包括使用者所产生的大量资料,及对外部所取得的资料,这些信息可能来自不同的数据库平台,或一些特定的档案格式。而ETL就是要将各个不同的数据文件或数据转载 2015-09-13 22:14:00 · 1133 阅读 · 0 评论