首先需要建立数据源模块,数据源可以来自于外部表,也可以来自于数据库,练习中使用的是数据库数据,通过向导导入源数据到数据源模块。
然后建立数据仓库目标模块,数据仓库目标模块用来存放经过ETL后的数据,可以是与数据源不同的数据库和用户下。
然后在目标模块下建立映射,用来将源模块数据映射到目标模块
在目标表上单击右键“选择创建并绑定”,OWB会在目标模块下自动生成目标表。
在表和映射上点击生成可以查看OWB自动生成的对应代码
然后在点工具下的控制管理中心,在这里完成部署和生成操作
首先对目标表部署,执行。在部署成功后,会在目标数据库生成相应的表结构,但并没有数据。
然后对映射部署,部署成功后会产生一个物理上的映射,最后点开始按钮执行映射。
映射执行成功后,源数据库下的表的数据就会装载到目标数据仓库。
至此练习结束。
注:
数据ETL(Extraction, Transformation and Loading) 是用来实现异构多数据源的数据集成的一个工具,它是数据仓库、数据挖掘以及商业智能等技术的基石。
ETL的功能包括:数据的抽取:从不同的网络、不同的操作平台、不同的数据库及数据格式、不同的应用中抽取数据;数据的转换:数据转化(数据的合并、汇总、过滤、转换等)、数据的重新格式化和计算、关键数据的重新构建和数据总结、数据定位、数据的加载、跨网络、操作平台,将数据加载到目标数据库中。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/12743356/viewspace-438855/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/12743356/viewspace-438855/