不慌,我也是刚听说这个词,一脑袋懵
一、ETL
什么是ETL?ETL是三个英文单词的缩写,即数据抽取、转换、装载的过程。对于企业或者行业应用来说,经常会遇到各种数据的处理,转换,迁移,所以掌握一种ETL工具的使用是必须的,Kettle就是ETL工具。
二、Kettle简介
1.Kettle是一款国外开源的ETL工具,纯Java编写的,绿色无需安装,数据抽取高效稳定。
2.Kettle中文:水壶,作者希望把各种数据放到一个壶里,然后以一种指定的格式流出。
3.Kettle能管理来自不同数据库的数据。图形化管理。
4.Kettle中有两种脚本文件,transformation和job,transformation完成对数据的基础转换,job完成整个工作流的控制。
5.Kettle已经改名为PDI
三、Kettle的结构

Kettle的结构1:Spoon和Data Integration Server
Spoon是构建ETL Job和Transformation的工具。
Spoon以拖拽的方式图形化设计,能够送过Spoon调用专用的数据集成引擎或者集群。
Data Integration Server是一个专用的ETL Server,它的功能有:

本文介绍了ETL过程,并详细讲解了开源ETL工具Kettle(PDI)的基础知识,包括其简介、核心组件、下载方式、目录结构以及部署步骤。Kettle提供图形化界面Spoon,支持数据处理和管理工作流。
最低0.47元/天 解锁文章
212

被折叠的 条评论
为什么被折叠?



