Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,这个工具真的很强大,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现,其中最主要的我们通过熟练的应用它,减少了非常多的研发工作量,提高了我们的工作效率
安装:
1.下载解压
https://community.hitachivantara.com/docs/DOC-1009855 下载 Data Integration 7.1
解压后可以得到目录Data-Integration
2.运行Data-Integration目录下的sqoop.sh
提示未安装webkitgtk
但是 yum install webkitgtk不能成功
后来 运行了以下下载的包成功了
使用csdn下载的 webkitgtk-2.4.9-3.el7.nux.x86_64.rpm
#rpm -ivh webkitgtk-2.4.9-3.el7.nux.x86_64.rpm
3.运行sqoop.sh

最低0.47元/天 解锁文章
367

被折叠的 条评论
为什么被折叠?



