一、Kettle概述
1.Kettle是一个ETL(Extract Transform Loading,数据抽取转换加载)工具软件,Kettle翻译成中文叫 水壶,是一款开源软件基于java编写,可以在Window、Linux、Unix上运行,绿色无需安装。
2.Kettle的英文官方网站是这个https://community.hitachivantara.com/docs/DOC-1009855
中文地址是:http://www.kettle.net.cn/
3.Kettle支持持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、数据同步、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的开发工作量,提高了我们的工作效率。
4.Kettle由以下几个产品组成
- Spoon 是一个图形用户界面,它允许你运行转化或者任务
- Pan 是转换(transform)的执行器,用来运行转化 是数据转换引擎
- Kitchen 是作业任务(Job)执行器 ,用来运行任务
- Chef 是工作(job)GUI设计工具
二、Kettle软件安装启动
1.在安装Kettle之前需要先安装好JDK 软件
(1)6.1及之前版本在JDK1.7环境下可以运行
(2)7.0以后的版本需要安装JDK1.8才能运行
2.下载Kettle
(1)在http://mirror.bit.edu.cn/pentaho/Data%20Integration/下载旧版本
(2)在https://community.hitachivantara.com/docs/DOC-1009855下载最新版本(截止目前8.2)
3.解压安装
(1)6.1版本文件是pdi-ce-6.1.0.1-196.zip
(2)8.2版本文件是pdi-ce-8.2.0.0-342.zip
(3)Kettle不需要安装 解压开就能用,解压之后是data-integration文件夹
4.启动
运行图形化界面Spoon
(1)Spoon.bat:在Windows平台运行Spoon
(2)spoon.sh:在Linux平台运行Spoon
(3)双击Spoon.bat(6.1版本)
启动画面如下:
启动完成如下:
(4)8.2版本启动界面
参考博文: kettle学习笔记.