数据仓库的数据交付与优化策略
1. 数据交付架构
1.1 后加载交付架构
后加载交付是指在数据经过转换并加载到数据仓库后,再由其他进程将数据提取并交付到目标数据集市或外部系统。这种方法存在数据接收与提供给数据集市之间的延迟问题,但如果流程安排中有足够时间,此劣势可能较小或不存在。其优点显著,一是便于控制流程并确保同步,数据仓库成为唯一数据源,保证所有下游系统接收相同信息;二是减少开发时间,只需开发一个从数据仓库向数据集市交付数据的单一流程,且交付流程的时间框架可由参数或控制表驱动,便于灾难恢复。
1.2 交易接口与交付建议
交易接口是处理最简单的接口之一,交易数据接收一次、完全可加且不更新,为数据仓库和数据集市的理想数据提取方式。不过,建议所有数据交付都从数据仓库进行,仅在交付时间至关重要的情况下考虑同时交付。若选择同时交付,需投入适当的流程基础设施,提供备用交付流程并进行适当审计,以确保与数据仓库的数据一致性。
1.3 交易信息记录的重要性
接收交易信息到数据仓库有多种方式,记录交易中推断的变化幅度和方向十分重要。这种变化驱动了大部分业务分析,在数据仓库中推导和量化变化有助于支持和简化分析。
2. 数据仓库优化
2.1 优化开发过程
2.1.1 优化设计与分析
建模方法是关键,遵循该方法可显著降低返工风险,提高对数据仓库内容的整体理解,有助于实施的成功。前期正确建模能缩短开发过程,提升开发体验。
2.1.2 优化应用开发
创建企业数据仓库是长期项目,需投入人力开发、实施和支
超级会员免费看
订阅专栏 解锁全文
1025

被折叠的 条评论
为什么被折叠?



