摘要:ETL工具是构建和维护数据仓库的基本构件,由于它处理的是海量数据,如何有效地加快响应时间成为值得研究的问题。本文提出了ETL过程的“主表衍生”模式,并针对这种模式采用流水线算法来提高并行性从而加快ETL过程的响应时间,理论分析和实验表明具有好的效果。
Optimization of ETL Execution by pipelining method(ETL执行的流水线优化)
ETL工具处理海量数据,加快响应时间是研究重点。本文提出ETL过程的“主表衍生”模式,采用流水线算法提高并行性,以此加快ETL过程的响应时间,理论分析和实验显示效果良好。

被折叠的 条评论
为什么被折叠?



