数据清洗小记 11 Kettle 利用设置变量实现数据增量(小例)

本文介绍了如何使用Kettle工具进行数据清洗和增量处理。通过设置变量获取最大hiredate,并以此作为条件插入目标表,实现数据的增量更新。同时,文章指出对于大量数据,应考虑使用时间戳记录表以提高效率。文章是‘蓝的成长记’系列之一,分享作者在DBA领域的学习和经验。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

                       

【背景】
利用kettle工具,完成某表的增量工作。
【解决】
利用模块完成即可,如下简图:
这里写图片描述
【实验】
先手工准备一个实验环境:
准备基本完成如下效果:
select t.*, t.rowid from EMP_ETL t
这里写图片描述
select max(hiredate) maxsj from EMP_ETL
这里写图片描述
我们验证将2015年10月22日的数据插入目标表中。
创建目标表:
create table EMP_ETL_1 as select * from EMP_ETL t where 1=2;
此时EMP_ETL_1数据为空,我们只插入hiredate 为2015/10/22的数据。
可以看到有两条数据符合这个条件,如下图所示:
这里写图片描述
编写时间戳ktr转换过程,把原表中最大的hiredate作为变量,如下图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值