本文主要介绍源表为单表时,增量数据同步的情况。当源表为多表时,后面的文章会继续介绍。
一、数据同步情况说明
将源数据库S中的A表(将此表称为源表),通过ETL工具同步至目标数据库T的A表(将此表称为目标表)。假设源表A的表结构与目标表A的表结构完全一致。表结构如下图所示:

采用时间戳的方式进行增量数据同步,需要目标数据库T中建立一张数据同步日志表LOG,来记录每次数据同步的情况。
表结构如下图所示:

其中,KSSJ、JSSJ字段为保存的值为源表A中每次数据同步时,根据ZHXGSJ字段进行数据过滤的字段值。
二、增量数据同步过程
1、结合源表的数据结构并确认源表的时间戳字段(在这里此字段名为ZHXGSJ,即最后修改时间)。注意,时间戳字段不能为空。若为空,则不能采用此方法进行数据同步。
2、单次增量数据同步流程图,如下图所示:
1)、开始。
2)、判断源表A中的数据记录数是否为0。即在源数据库S下执行下面语句:
select count(1

本文详细阐述了如何使用时间戳字段ZHXGSJ进行单表的增量数据同步,从数据同步日志表的建立到同步过程的各个步骤,包括首次同步和后续同步的处理,并提醒注意可能存在的数据不一致问题。此外,还批判了仅依赖sysdate-1进行增量同步的不严谨做法。
最低0.47元/天 解锁文章
3546

被折叠的 条评论
为什么被折叠?



