kettle(ETL)的简单使用
最近刚接手一个新项目,接触了一个叫kettle的工具,这玩意可以用在数据同步,数据清洗,跨数据源等问题,而且不需要写代码,简单易懂。
以下来源百度百科:
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。
工具
首先用到Spoon工具,这个工具可以图形界面化的操作。简单易懂。
Spoon可以新建转换、作业两种文件。
1.转换
主要的业务逻辑就是在转换里完成的,比如数据的清洗,数据的同步,输出文件等。
新建一个转换,可以在核心对象里找需要萃取的数据来源,比如表、Excel文件、Json等都在【输入】文件夹里,直接把图标拉倒右边空白处即可
比如我这边拉了一个表输入
然后双击表输入显示以下窗口
先编辑步骤名称比如[数据源A的表输入],然后新建数据源,填好对应的数据源名称,数据源对应的信息