简介
一款ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)工具,可以做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等数据处理。
主要文件
1.转换文件,后缀krt。
2.作业文件,后缀kjb。
组件树介绍

DB连接:双击创建/显示数据库连接信息。显示当前transformation中的数据库连接,每一个transformation的数据库连接都需要单独配置。
Steps:一个transformation中应用到的环节列表。
Hops:一个transformation中应用到的节点连接列表。
转换
| 类别 | 操作 | 说明 |
|---|---|---|
| 输入 | 文本输入 | 从本地文本文件输入数据 |
| 表输入 | 从数据库表中输入数据 | |
| 输出 | 文本文件输出 | 将处理结果输出到文本文件 |
| 表输出 | 将处理结果输出到数据库表 | |
| 插入/更新 | 根据处理结果对数据库表机型插入更新,如果数据库中不存在相关记录则插入,否则为更 |

本文介绍了PDI(Kettle)作为数据抽取、转换和加载工具的基本使用,包括主要文件类型如转换(ktr)和作业(kjb)。详细讲解了如何创建数据库连接、设计转换流程,例如从表输入到表输出的数据处理,并展示了如何执行转换文件。同时,文章提到了作业的概念,用于串联多个转换,以实现更复杂的ETL流程。
最低0.47元/天 解锁文章
3442

被折叠的 条评论
为什么被折叠?



