
ETL
文章平均质量分 82
Warren
DW/BI modeler ETL architect
展开
-
ETL 38子系统
To create a successful data warehouse, rely on best practices, not intuition.Three little letters -- E,T, and L -- obscure the reality of 38 subsystems vital to successful data warehousing.By Ra转载 2013-06-10 14:56:43 · 691 阅读 · 0 评论 -
ETL系列专题2——ETL中的数据结构
数据结构这个名词对计算机科学专业的同行一定十分熟悉,在我们工作中也是无处不在地使用数据结构,本章节首先介绍一下数据结构的概念和主要作用(请大家忍受一下笔者的啰嗦),然后着重介绍一下数据结构在ETL中的使用。什么是数据结构数据结构是针对数据的组织与存储需要而设计的一种数据格式。常见的数据结构类型有数组,文件,记录,线性表,链表,树,图等等。任何一种数据结构的选择和设计的目的都是为了更加方便地翻译 2013-06-15 17:45:53 · 2147 阅读 · 0 评论 -
ETL系列专题3——ETL之E
ETL系列专题3——ETL之E从本章开始介绍基于ETL的数据流架构,首先介绍E(Extract)过程。抽取(Extract)没有数据,DW/BI的模型再好也没有任何用处。数据集成的第一个步骤就是从业务系统中抽取(Extract)数据。伴随着企业的蓬勃发展,业务的不断扩张,相应的信息系统也随之多种多样:销售管理系统,供应链系统,库存系统,产品控制系统……这些系统通常来自于不同软件供应商,原创 2013-06-15 14:29:49 · 2287 阅读 · 0 评论 -
ETL系列专题 1——DW/BI的基石
ETL系列专题 1——DW/BI的基石Warren zqw_qw@hotmail.com在DW领域中真的不敢说有什么大的经验,因为之前一起工作的中外同事都不知道要比我高深多少。如果说他们是太平洋,我充其量就是我现在身边的这杯水,还被我喝掉了半瓶!开始想写时还真不知道写点什么?那就索性先写点ETL的东西吧,该系列将主要介绍Kimball ETL架构理论,期间会加入笔者的一些拙劣想法或翻译 2013-06-15 17:57:05 · 1832 阅读 · 0 评论 -
ETL系列专题4——ETL之T
ETL系列专题4——ETL之T转换(Transform),是ETL过程中最复杂的部分,ETL中E和L都非常容易理解,Extract从源系统中提取数据,Load将数据载入星型模型。而转换的过程涉及到更多的内容,Kimball把这个过程拆解为清洗(Clean)和统一化(Conform), 这样更容易从数据流的角度去理解ETL过程,实际工作中,我们一般把这两项工作在物理上作为一个过程来处理,比如翻译 2013-06-17 22:08:08 · 2685 阅读 · 0 评论 -
ETL系列专题6——Load之FactLoad
ETL系列专题5——Load之FactLoadWarrenzqw_qw@hotmail.com事实表包含企业业务分析所需要的量度,通常表现为数值型数据。那么事实表和量度的关系怎样?可以这么理解,如果有一个量度,那么它会存在于事实表中的一行记录中。事实表的基本结构事实表的粒度,我们知道事实表的粒度可以通过维度外键来确定。但是确定事实表数据粒度的正确次序应该首先从量度实际发生的现实翻译 2013-07-12 16:45:55 · 1085 阅读 · 1 评论 -
ETL系列专题5——L之DimLoad
ETL系列专题5——Load之DimLoadWarrenzqw_qw@hotmail.comL(Load),装载,就是把准备好的数据加载到Star-Schema。Kimball把这个步骤称作Delivery,这个词在软件业务中更专业,但是Load是从数据流角度的直观理解。其实笔者更喜欢Delivery这种说法,Delivery包含了除数据交付之外更多的涵义(ETL处理之后的交付物是加载翻译 2013-06-23 11:42:35 · 1329 阅读 · 0 评论