一、简介
在过去的十年里,我们存储和管理数据的方式已经彻底改变了。我们从 E“TL” 世界进入了 E“LT” 世界,诸如Fivetran 这样的公司推动了这一趋势。然而,我们并不认为它会止步于此; ELT 是我们头脑中向 EL (t)(与 EL 解耦)的过渡。为了理解这一点,我们需要辨别出这一趋势的潜在原因,因为它们可能显示出未来会发生什么。
二、传统ETL的问题
从历史上看,ETL数据管道过程包括将数据提取、转换和装载到仓库或数据湖中。这种顺序有严重的缺点。这些缺点是:不灵活、不直观、无自助。
- 不灵活
ETL 从根本上来说就是刻板和僵化的。在这个模式下,数据分析师必须提前知道要如何分析数据,如何生产报告。因此,ETL的细微调整都会很麻烦,而且这个调整也可能会进一步影响下一个步骤的数据消费者。 - 不直观
每次ETL中数据转换(Transformation)时,有的原始信息也变的更加不清楚。这种情况下,数据分析师只会看到转换阶段加工后的数据,而不是数据仓库中所有的数据。
基于上述这种不合理分割加工数据, 分析师所能得出的分析结论就是有风险的。
也许有的数据分析师也经历过类似情况。 在多个环节或者系统数据对接时,经常需要核对双方数据的一致性,正确性。 耗时、耗力,还带来个合