ETL - 实战 Kettle 第二讲

本文介绍如何使用 Kettle 进行复杂的转换,涉及从两个数据库获取关联数据。通过创建表输入步骤、记录集连接(Merge Join)进行左外连接,将旧数据库的订单数据与新数据库的客户信息进行合并,并通过表输出步骤将结果写入目标表。教程以‘订单客户关联数据迁移’为例,详细讲解了每个步骤的配置,包括数据库连接、SQL 查询和字段映射。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前(fei)言(hua)

现在我们开始较为复杂的转换,我们需要来自两个数据库的关联数据。我们需要来自旧数据库的订单数据,还需要来自新数据库的客户表主键 id 和 name 来填充外键。我们将创建两个表输入、一个记录集连接(关联)和一个表输出

  1. 创建一个新的转换,另存为“订单客户关联数据迁移”。
  2. 创建一个步骤表输入,新建数据库连接,为该步骤指定一个名称,编写查询,也可以直接点击获取SQL查询语句按钮获取,如下:
    在这里插入图片描述
  3. 创建另一个步骤表输入,步骤名称“获取客户表id”,选择现有的 new_db_order 连接,并编写以下查询:
    在这里插入图片描述
  4. 这是一个比较难理解的步骤。查找并添加步骤记录集连接(即关联 Merge Join)。此步骤的目的是在第一步和第二步的结果之间执行左外连接。PDI 的强大之处,就在于它可以合并来自不同数据库的两个表。连接步骤如下:
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值