ETL工具 --- Kettle的简介与安装


一、简述

1. Kettle简介

  kettle是一个开源的ETL(Extract-Transform-Load, 数据抽取、转换、装载)工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。KDE最早源于K Desktop Environment。2006年,Pentaho公司收购Kettle项目,原Kettle项目发起人Matt Casters加入了Pentaho团队,成为Pentaho套件数据集成工程师,从此Kettle成为企业级数据集成及商业智能套件Pentaho的主要组成部分,Kettle重名为Pentaho Data Integration(PDI)。2015年,Hitachi(日立) Data Systems收购了Pentaho公司。
  Kettle分为商业版和开源版,由Java语言开发,支持跨平台运行,可以在Windows、Linux上运行,绿色且无需安装,数据抽取高效稳定。如今,在各个企业中,数据处理几乎成为数字化发展的必要过程,而数据处理的过程即数据抽取、统计分析、转换、装载的过程,因此各个企业目前都需要ETL工程师来完成数据处理工作。

2. Kettle架构

在这里插入图片描述

  • JOB:作业
    • 作业又称为步骤流或者控制流
    • 在作业中,可以挂载转换任务,也可以挂载job任务
    • 作业中的各个组件按照顺序执行,可以对执行的结果进行判断并处理分支
    • 作业可以检测数据表、文件是否存在,执行Shell脚本,执行SQL脚本,获取数据、发送邮件等
  • Transformation:转换
    • 在大部分场景下,可以直接称之为“数据流”
    • 完成数据的输入→处理→输出过程
    • 一旦启动一个转换任务,则其中的所有组件会同时启动,并根据配置逐条处理数据。

核心组件:

组件描述
spoonspoon是kettle的图形化工具,可以通过简单的拖拉拽方式完成kettle任务的设计、运行和调用。
panTransformation执行器(命令行方式),Pan用于在终端执行Transformation,没有图形界面。
KitchenJob执行器(命令行方式),Kitchen用于在终端执行Job,没有图形界面。
Carte嵌入式Web服务,用于远程执行Job或Transformation,Kettle通过Carte建立集群。

二、Kettle 9.1安装步骤(附安装包)

Tip:为了使spoon.bat图标更加美观:
    1. 创建快捷方式。
    2. 右键快捷方式打开属性,点击如图所示更改图标
在这里插入图片描述
    3. 选择Kettle解压目录下的spoon.ico图标文件,点击确定。
在这里插入图片描述

### Pentaho Kettle 下载安装指南 对于希望获取最新版本的 Pentaho Data Integration (Kettle),官方渠道和其他可信资源提供了多种下载途径。 #### 官方网站下载 访问官方网站是获得软件最直接的方式之一。然而,需要注意的是,有时官方网站可能不会总是展示最新的稳定版。因此,在查找特定版本时,建议查阅多个来源以确认最适合需求的版本[^1]。 #### 开源平台获取 除了官方站点外,开源代码托管平台上也能找到所需的安装文件。例如,在 GitCode 上存在一个专门用于分发 Pentaho Data Integration (Kettle) 9.3.0.0 版本安装包的仓库,该项目地址为 [https://gitcode.com/open-source-toolkit/eb9ef](https://gitcode.com/open-source-toolkit/eb9ef)。此链接指向了一个具体的版本,适合那些需要该确切版本的人士使用。 #### 社区推荐版本 考虑到不同应用场景下的稳定性差异,某些教育机构或技术社区可能会基于实践经验向用户推荐特定的历史版本。比如尚硅谷资料中提到的 kettle8.2 的版本被认为更加稳定和经典[^2]。虽然这不是最新发布的版本,但在实际应用中表现良好,值得考虑作为替代选项。 #### 第三方分享服务 部分第三方云存储服务商也提供了 Kettle 不同版本的镜像下载。这些通常由个人或小型团队维护,并附带详细的安装指导文档。值得注意的是,从这类非官方渠道下载前应仔细核对文件的安全性和合法性[^3]。 完成下载后,按照常规流程解压缩并执行 `Spoon.bat` 文件启动应用程序即可开始配置工作环境。如果计划连接 MySQL 数据库,则需额外准备相应的 JDBC 驱动程序并将它放置于指定路径下以便建立有效的数据库连接。 ```bash # 解压后的根目录下运行 Spoon.bat 启动 PDI 工具 .\Spoon.bat ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值