在针对某个维度模型开始ETL系统设计之前,应当完成逻辑设计,草拟高层架构计划,并且为所有的数据元素拟定源到目标映射。
ETL的设计过程十分重要:
- 收集所有的相关信息,包括事物处理系统中所允许的提取处理载荷,并测试一些主要的供选计划;
- ETL系统对管理源系统、目标系统或者自身平台上的转换过程是否有意义?
- 每个系统中可以使用的工具有哪些,效能如何?
- 也许需要从零开始写一些代码,包括SQL查询语句和自动控制脚本程序。
ETL开发按照一个迭代的、交互的过程进行,但是基本的系统开发习惯仍然适用。
优良的系统开发习惯的重要性:
- 为代码设置一种标题格式并建立注释字段
- 及早进行结构化设计审查,以便有足够多的时间进行更改
- 代码书写要规范利落,并且有详细的注释
- 坚持命名标准
- 使用代码库和管理系统
- 测试所有环节——包括单元测试和系统测试
- 编制文档记录所有事项