kettle中转换和作业的执行顺序:
1、一个作业内的转换,是顺序执行的。
2、一个转换内的步骤是并行执行的。
3、作业内不支持事务,转换内支持事务。
根据业务需要,通常需要在转换内顺序执行,小技巧如下:
1、执行SQL是优先于所有步骤。
2、使用“阻塞数据直到步骤都完成”,确保其他数据步骤都完成再进行下一步骤。
事务:
1、设置转换只使用一个事务。转换设置-->夹项-->使用唯一连接。
2、设置转换内的表插入等数据库的操作不进行批量提交。"提交记录数量"-->0
I 当前步骤生成的记录数(从表输出、文件读入)
O 当前步骤输出的记录数(输出的文件和表)
R 当前步骤从前一步骤读取的记录数
W 当前步骤向后面步骤抛出的记录数
U 当前步骤更新过的记录数
E 当前步骤处理的记录数
本文详细解析了Kettle中作业与转换的执行顺序,包括转换内的并行执行特性,以及如何通过特定步骤实现顺序执行。同时,介绍了事务处理方式,如设置单一事务和禁用批量提交,以确保数据一致性。
5997

被折叠的 条评论
为什么被折叠?



