一张图看懂Kettle

101949_OHqT_120230.png


· Spoon: The integrated development environment. Offers a graphical user interface for creating and editing job and transformation definitions. Spoon can also be used to execute and debug jobs and transformations, and it also includes functionality for performance monitoring.

     Spoon : 集成开发环境。提供用户图形界面化创建和编辑任务和转换定义。同时也能提供执行和调试任务和转换,并且还包括性能监控功能。

· Kitchen: A command line–driven job runner, which can be used to integrate Kettle with OS-level scripts. It is typically used to schedule jobs with a scheduler such as cron, at, or the Windows Task Scheduler.

     Kitchen:一个命令行的任务执行器(注意不是转换),可被用来与操作系统层的脚本集成。通常结合使用例如cron,at 或windows任务管理器定义周期性任务。

· Pan: A command line–driven program just like Kitchen, but it is used for executing transformations instead of jobs.

     Pan:通Kitchen一样是命令行方式执行器,不过这个仅仅能执行转换定义,而不是任务。

· Carte: A light-weight server (based on the Jetty HTTP server) that runs in the background and listens for requests to run a job. Carte is used to distribute and coordinate job execution across a collection of computers forming a Kettle cluster.

    Carte:一个运行在后头的轻量级服务(基于Jetty的HTTP服务),通过监听请求来运行任务。使用Carte在Kettle集群分发和协作任务的执行。

                

转载于:https://my.oschina.net/frankwu/blog/212194

### 安装Java环境 在Ubuntu系统上安装Kettle 9.1之前,首先需要安装Java环境。推荐使用JDK 8版本,例如JDK 8u251,因为这是经过验证的版本,可以避免潜在的兼容性问题[^1]。 1. **下载JDK**:可以从Oracle官方网站下载JDK 8u251。 2. **安装JDK**:解压下载的JDK包,并将其移动到合适的目录,例如`/usr/local/java/`。 3. **配置环境变量**:编辑`/etc/profile`文件,添加以下内容以设置`JAVA_HOME`环境变量并更新`PATH`: ```bash export JAVA_HOME=/usr/local/java/jdk1.8.0_251 export PATH=$JAVA_HOME/bin:$PATH ``` 4. **应用更改**:运行`source /etc/profile`命令使更改生效。 ### 下载KettleKettle(现在称为Pentaho Data Integration, PDI)的官方网站下载Kettle 9.1版本。确保下载的是适用于Linux系统的版本。 ### 安装Kettle 1. **解压文件**:将下载的Kettle压缩包解压到一个合适的目录,例如`/opt/pdi/`。 2. **配置权限**:为解压后的目录设置适当的权限,以便用户能够运行Kettle。 ### 配置Kettle 1. **调整内存设置**:编辑Kettle的启动脚本`s spoon.sh`(对于Linux系统),调整JVM的内存设置。找到并修改以下行: ```bash if [ -z "$PENTAHO_DI_JAVA_OPTIONS" ]; then PENTAHO_DI_JAVA_OPTIONS="-Xms256m -Xmx512m" fi ``` 根据系统的实际情况调整`-Xms`和`-Xmx`参数,以优化性能。 2. **运行Kettle**:通过终端导航到Kettle的安装目录,然后运行`s spoon.sh`来启动Kettle形界面。 ### 连接Hadoop 如果需要Kettle连接Hadoop集群,还需要进行额外的配置: 1. **复制配置文件**:将Hadoop集群的`*-site.xml`文件复制到Kettle的配置目录中。 2. **配置YARN Shims**:按照Pentaho官方文档中的说明配置YARN Shims,以确保Kettle能够正确地与Hadoop交互[^4]。 ### 相关问题 1. 如何在Ubuntu上配置Kettle的环境变量? 2. Kettle连接Hadoop的具体步骤是什么? 3. 如何调整Kettle的内存设置以提高性能? 4. Kettle中Transformation和Job的区别是什么? 5. 在Ubuntu上安装Kettle时遇到Java版本不兼容的问题该如何解决? 以上步骤提供了在Ubuntu系统上安装和配置Kettle 9.1的基本指南,确保每一步都按照要求执行,以保证Kettle能够正常运行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值