ETL 映射设计与暂存区搭建全解析
1. 预处理和后处理操作符
在数据映射过程中,有一小类操作符十分关键,它们能让我们在映射过程开始前或结束后执行特定操作,这就是预处理和后处理操作符。借助这些操作符,我们可以在映射运行前后执行函数或过程,还能在映射过程中接受输入或提供输出。下面为大家详细介绍几种常见的操作符:
- 映射输入参数(Mapping Input Parameter) :该操作符可将参数传入映射过程。通过接受可能变化的常量值作为输入,而非将其硬编码到映射中,能让映射更具通用性。例如 DATE_DIM_MAP 就将映射输入参数操作符作为其最左侧的第一个操作符。
- 映射输出参数(Mapping Output Parameter) :从名称就能看出,它与映射输入参数操作符类似,但用于从映射中提供输出值。
- 映射后处理(Post - Mapping Process) :允许我们在映射处理完成后调用函数或过程。比如,当映射完成后,我们可能需要自动进行一些清理工作,像删除已使用过的表(可能是映射过程中使用的暂存表)中的所有记录。
- 映射预处理(Pre - Mapping Process) :其功能不难理解,它能让我们在映射过程开始前调用函数或过程。假设映射需要对一个数据值进行键查找,且该值要存储在每个输出行中,但我们不想为每个输入记录都调用键查找操作符。这时,就可以使用映射预处理操作符在开始时调用一次函数,这样返回的值就能供处理的每一行使用,而无需重新调用该过程。
此外,在某些文档中还提到了第四类操作符——可
超级会员免费看
订阅专栏 解锁全文
1291

被折叠的 条评论
为什么被折叠?



