2.1 Kettle简介
Kettle是一款国外免费开源的轻量级ETL工具,是基于Java语言开发的。它主要由四个组件组成:
- SPoon:Kettle的集成开发环境,提供
2.2Kettle的下载安装
1、Kettle官网的下载地址为:http://sourceforge.net/projects/pentaho/files/Data%20Integration/,在官网下载安装包。
2、解压文件,执行spoon.bat。
3、配置Kettle(在网上搜索即有详细的引导步骤)。
4、启动Kettle。
2.3Kettle的基本概念
Kettle工具的执行分为两个层次,即转换和作业,这两个层次最主要的区别在于数据传递和执行方式。
2.3.1转换
转换是ETL解决方案中重要的组成部分之一,主要用于数据的抽取、转换以及加载等多个操作,其本质是一组图形化的数据转换配置的逻辑结构。下图为Kettle转换实例:
转换中主要包括以下几个步骤:
1、步骤:是转换里的基本组成部分,也被称为控件。每个步骤度会有一些关键特性,具体的如下所示:
- 每个步骤都必须有一个名字,且这个名字在转换范围内唯一。
- 每个步骤都可以读写数据行。
- 步骤将数据写到与之相连的一个或多个输出跳,再转送到跳的另一段的步骤。
- 大多数的步骤都可以