kettle系列之一基础知识

最新推荐文章于 2025-06-25 12:44:37 发布

原创最新推荐文章于 2025-06-25 12:44:37 发布 · 620 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#kettle #PDI #ETL

kettle 专栏收录该内容

6 篇文章

订阅专栏

本文介绍了开源ETL工具Pentaho Kettle（PDI）的基础知识，包括其用途、支持环境和源码编写语言。文章详细阐述了如何在Windows和Linux环境下搭建基础环境，包括直接下载安装包、本地编译源码、安装MySQL驱动以及启动方法。此外，还解释了PDI中的作业（Job）和转换（Transformation）概念，并提供了资源库的两种类型及其应用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

简介

pentaho-kettle是一款开源的ETL工具，官方名称是Pentaho Data Integration，主要是用来做数据库迁移等，支持面很强大，易学难精。

支持在windows和linux下使用，但是linux下不一定有图形界面，本来作为服务器一般都不会有图形界面的，所以设计工作主要在windows环境下完成。

源代码使用Java编写。

弊端：文档比较杂乱，不好搜资料。

参考：https://blog.youkuaiyun.com/u010192213/article/details/77646142

基础环境搭建

前提，版本8.1

有2种搭建方式，推荐第一种

直接在官网下载安装包，解压即可用

步骤1，下载JDK1.8及以上，并安装

步骤2，下载PDI编译后的安装包，解压

下载链接：https://sourceforge.net/projects/pentaho/files/

也可以下载7.1稳定版本

下载官方源码，本地编译打包

官方开源地址：

https://github.com/pentaho/pentaho-kettle/tree/8.1.0.5

编译过程直接参考官方文档：注意maven要配置pentaho的仓库

使用maven打包，生产zip文件夹，直接解压就可以使用

下载MySQL驱动包

mysql-connector-java-5.1.47.tar.gz

解压后把mysql-connector-java-5.1.47.jar放到PDI的lib目录下即可

启动

windows下双击spoon.bat即可启动PDI的图形界面

文件夹下的samples下面是官方的demo，建议搞懂每一个例子，大部分的需求都是这些官方demo排列组合就可以完成的。

概念

文件扩展名：

kjb: job，作业

ktr: transformation，转换

作业可以包裹多个转换和作业

强烈建议：不要直接执行转换，用一个作业来包裹转换，执行作业，以便统一管理。

资源库：

资源库分2种，参考https://www.cnblogs.com/zigewb/p/4502938.html

文件资源库，把job/transformation保存为kjb/ktr结尾的文件，调用的时候传入路径和文件名。

数据库资源库，默认账号admin/admin，把job/transformation保存到数据库中。

选择哪一种资源库，基于需求决定，数据库容易统一管理，但是没有版本控制，文件库可以使用svn等版本控制工具控制版本。

工具：

PDI解压之后，有提供以下几个工具

Spoon，完整的带图形界面的设计/执行工具

Pan，用来执行转换的命令行工具

Kitchen，用来执行作业的命令行工具

Carte，用来开启一个服务器，可以远程调用作业或者转换，基于命令行，主要用于搭建集群的PDI环境

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。