1.需求
将ods_cust_info表抽取到edw层,当表中有新增记录,只抽取新增记录,而不全表重新执行抽取。
2.操作
1.导入源表:从oltp用户下导入ods_cust_info表。
2.定义目标表:根据源表,在目标表新增edw_date日期字段,命名为edw_cust_info表,在edw用户下创建该表。
3.创建映射:
使用lookup查找转换组件,查找目标表edw_cust_info,设置目标表的edw_cust_id与源表的ods_cust_id相等,若没有相等,则说明是新增的数据,抽取到目标表中。


设置连接来源是edw层。

使用update更新策略转换组件,标记要插入、删除、更新或拒绝的记录的表达式,本需求是要求当edw_cust_id为空的时候就插入到表中,否则拒绝插入。
把源表的字段全部拉到update组件,再从lookup组件中把edw_cust_id字段拉到update组件,当edw_cust_id为空时,就插入源表的所有字段到目标表,若edw_cust_id不为空,则不插入。(这就是增量抽取)</
informatica增量抽取实现步骤

本文档详细介绍了如何使用informatica进行增量数据抽取。首先,根据需求只抽取ods_cust_info表中的新增记录。接着,从oltp用户导入源表,创建带有edw_date字段的目标表edw_cust_info。通过lookup查找转换组件,对比源表和目标表,当edw_cust_id为空时,插入源表数据。更新策略组件用于控制插入条件,expression转换组件添加日期时间字段。最后,创建任务和工作流,确保只有新增记录被抽取到目标表中。经过测试,新添加的记录能成功抽取。
最低0.47元/天 解锁文章

1761

被折叠的 条评论
为什么被折叠?



