Kettle 相关知识

最新推荐文章于 2025-07-02 10:32:23 发布

zoujunjie202

最新推荐文章于 2025-07-02 10:32:23 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： KETTLE 文章标签：数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/zoujunjie202/article/details/50371984

本文介绍了如何使用Kettle的单步执行命令运行作业和转换，并详细讲解了Kettle中的一些常用组件，如作业、转换、Generate Rows、Add Sequence等，以及它们在数据处理中的作用。通过学习，你可以更好地理解和运用Kettle进行数据操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Kettle 单步执行作业或者转换

./pan.sh -file=/home/www/analysis/Application/Home/dfsolapetl/transformations/member/shopnc_member.ktr -debug=debug -log=/home/www/ktrLog.log

./kitchen.sh -file=/home/www/analysis/Application/Home/dfsolapetl/jobs/ext_stage.kjb -debug=debug -log=/home/www/kjbLog.log

Kettle常用组件学习

作业：负责将[转换]组织在一起进而完成某一块工作，通常我们需要把一个大的任务分解成几个逻辑上隔离的作业，当这几个作业都完成了，也就说明这项任务完成了。
转换：定义对数据操作的容器，数据操作就是数据从输入到输出的一个过程，可以理解为比作业粒度更小一级的容器，我们将任务分解成作业，然后需要将作业分解成一个或多个转换，每个转换只完成一部分工作。

Generate Rows（输入->生成记录）：用于生成指定数量的空行，后面的组件就是针对每一行进行操作。
Add sequence （转换->增加序列）：用于生成序列。使用的时候要明白，不依赖数据库来生成序列的话，序列值会在每次启动转换的时候复位。另外也可以利用Get ID from Slave Server来获取序列号，不过获取的序列号并不一定按次序产生的，只能确保比上次产生的值要大。
脚本->JavaScript代码：使用javascript代码对每一行记录进行编辑，可以编辑前面组件进来的字段，也可以新生成字段。
Sorted Merge（连接->排序合并）：把多个来源的数据进行合并，并且对记录进行排序。
Sort rows （转换->排序记录）：对记录进行排序。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。