最近由于比较多的与新的第三方系统进行各种数据的交互,免不了要把实时的用户表格以及代码表格同步过去,这个时候我们就想说使用比较低成本和简单的方式把我们需要的数据正确的同步到一个中间库中去,然后再由第三方系统通过同样的方式从中间库中取得相关的数据。
于是我们就使用上了ETL。
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。 --百度百科
说的明白点ETL就是可以实现多个数据库之间的数据转存的一种技术吧,也就是从DB1中将某些数据以一定的逻辑转存到DB2的指定表格中。
接下来我们就要讲到我们所使用的工具了,由于我们的工作的情况,所以我在这里使用的是KETTLE作为我们的ETL工具。(注:ETL