ETL是什么（最有意思的比喻）

ETL概念解读

最新推荐文章于 2025-03-19 13:50:58 发布

转载最新推荐文章于 2025-03-19 13:50:58 发布 · 1.5k 阅读

数据库专栏收录该内容

2 篇文章

订阅专栏

本文通过一个生动的故事比喻，解释了ETL（数据提取、转换和加载）的基本概念及其在构建数据仓库过程中的作用。

转载：https://blog.youkuaiyun.com/tuyi541601377/article/details/41011275/

Extraction-Transformation-Loading的缩写，中文名称为数据提取、转换和加载。不好理解，那ETL到底是什么？先讲一个故事吧。

阿杰结婚一年了，事业家庭都稳定了下来，准备要生BB了，父母听到这个消息，非常高兴，坚持要从另一个城市搬过来帮忙。但是，阿杰现在住的地方是一个一房一厅，有点小，所以，得搬一个大点的房子。于是，阿杰找到了一间新房子：三房两厅两卫，还有一个大阳台。

终于落实好，就要准备搬家了。一个周末，小夫妻两个人将旧住所中需要的东西打好包，而一些不再需要的东西就只有丢掉了，忙碌了整整一个上午。中午，搬家公司来了，将打包的东西运到新住所，接下来，两个人又开始忙碌，将打包的东西解开，重新整理，摆放。原来的洗衣机是挤在卫生间的，现在终于可以放到阳台上了......。

下午，父母的东西也运过来了。要将他们个人的东西放到另一个卧室，对了，他们还带了一个电饭煲，阿杰原来也有一个的，这个还得想办法处理一下......好了，好像还缺点什么，需要再去采购些物品......

经过周末两天的忙碌，终于，按照自己和父母的喜好，重新摆放好了，真舒适啊：一进客厅，黑白色调的沙发、茶几和电视显的素雅而高贵，特别是墙上的照片，从两个人认识、恋爱到结婚，讲述着一个迷人的爱情故事。餐桌上摆着父母带来的青花瓷茶具，泡出来的茶中溢着岁月的沉香；进到主卧，大大的梳妆台和衣柜是女主人的最爱，而床头的书架，则是男主人的地盘......进到客卧，深色的衣柜和床，有些复古的感觉，窗台上的白玉兰花沐浴着阳光，这是父母共同的爱好......

阿杰从此过上了幸福的生活。

好吧，故事讲完了。这个故事是在讲屌丝逆袭，赢得白富美芳心，然后比翼双飞的现代童话吗？还是房地产公司精心策划的广告？

都不是，我们想用它来说说ETL是什么的。好吧，言归正传，我们重新来讲一遍故事。

阿杰（已经使用的ERP）因为要生BB（正要实施的MES）加上父母（已经使用的HR）要过来，所以，需要换一套大的房子（DW数据仓库）。大房子会根据实际的需求进行规划（三房两厅两卫，还有一个大阳台）。

ETL就是搬家的过程。

搬家第一步，我们要将旧住所的东西打包；第二步，我们叫来搬家公司将打包的东西运输到新住所；第三步，我们在新住所将打包的东西解开，重新整理，摆放。

ETL主要有两种任务，一种是数据流任务，相当于将旧住所打包的东西运输到新住所；一种是清理任务，相当于在新住所重新整理摆放。

打包的过程中已经将不需要的东西丢弃了，数据仓库也只将分析主题需要的表或字段才搬过去；我们打包的时候不会先想着哪些东西都是要放到新房子主卧的，再将这些东西全部放在一起打包。如果谁这样做，你一定认为他有强迫症。——想一想我们现在是如何开发报表的？是不是要根据最终的结果，将所有用到的东西通过复杂的存贮过程一次性展示出来？——其实，ETL的过程比写报表的过程，要简单许多，你相信吗？反正我是信了。

不管原来是如何摆放的，我们在新的住所，会重新摆放，就好象原来的洗衣机是挤在卫生间的，现在终于可以放到阳台上了。而不同的业务系统，会有许多相同的基础资料，如都有部门这个基础资料，但大家的编码或名称可能不一样，这就需要额外处理一下，就好象父母也带了一个电饭煲需要想办法处理一样。——我们总不能厨房里两个电饭煲同时使用吧？

构建数据仓库时，总会有一些数据可能并不存在于某个业务系统中，如电商平台的数据，或者手工维护的预算数据。要使用这些数据，就需要额外导进去，就好象还缺点什么，需要再去采购些物品一样。

阿杰小两口周末两天的忙碌是辛苦的，但也是值得的。ETL的意义或价值，就好象阿杰小两口的忙碌一样，是为了最后有一个舒适的新家。

数据仓库构建好后，才有可能基于数据仓库来构建分析模型并根据自己的喜好展现最终的结果。客厅里一目了然的就是管理驾驶舱，既有ERP的信息（阿杰的电视），也有HR的信息（父母的茶具），而进到主卧，则好象进入到某个具体的分析主题一样；而进到客卧，则进入到了另外一个分析主题。

ETL的质量决定了BI是否成功（阿杰从此过上了幸福的生活。）