文章来自IBM官网。只转链接:
用IBM WebSphere DataStage进行数据整合
第 1 部分
https://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0602zhoudp/
传统的数据整合方式需要大量的手工编码,而采用 IBM WebSphere DataStage 进行数据整合可以大大的减少手工编码的数量,而且更加容易维护。数据整合的核心内容是从数据源中抽取数据,然后对这些数据进行转化,最终加载的目标数据库或者数据仓库中去,这也就是我们通常所说的ETL过程。IBM WebSphere DataStage 为整个 ETL 过程提供了一个图形化的开发环境。本文将从以下几个方面来介绍 IBM WebSphere DataStage:
1. 数据源连接能力
2. 完备的开发环境
3. ETL Job 的并行执行能力
4. 开发一个简单的 ETL Job
。。。。。。第 2 部分
http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0604zhoudp/系列的第一部分介绍了 DataStage 的基本功能。本文将从以下几个方面深入介绍 IBM WebSphere DataStage 在数据整合方面的强大功能。
1. Job Sequence 的用法
2. DataStage Container 的用法
3. 开发一个同时处理多个数据源和目标的 ETL Job
第 3 部分: 实时数据整合
本文主要包含以下几部分内容:
1. RTI Job特性介绍
2. 开发一个RTI Job
3. 将RTI Job发布成Web Service
4. 利用Java客户端调用发布好的Web Service