informatica学习笔记

Repository manager(资料库内容管理客户端工具)管理repository service(元数据资料库服务)。

Administratortion console(基于web的管理控制台)管理integration service(数据抽取、转换、装载服务)。

一.INFA开发流程:

R用来在使用infa开发之前做一些准备工作,比如创建用户,创建工作文件夹

D用来设计etl流程,主要用到3个区域,源工作区,目标工作区,mapping工作区

第一步:定义源  (使用D)

第二步:定义目标  (使用D)

第三步:创建映射(mapping)  (使用D)

第四步:定义任务  (使用W)

1.  2.

第五步:定义工作流  (使用W)

1.   2.点击下的wizard

 改为

  1. 双击,点击mapping来设置源和目标
  2. 右击空白处,点击start workflow

 

第六步:工作流调用监控,在任务调度起来的时候进行监控

  • 组件介绍

组件类型:

Passinve组件:流入流出组件的行数不发生变化,例如:expression组件

Active组件:流入流出组件的行数会发生变化,例如:aggregaor组件

 

Expression组件:对一行的数据进行赋值、修改、计算等处理,在同行记录中可新增、减少数据项,应用范围:数据类型转换、数据项计算、新增变量等

Filter组件:用于数据过滤,类似WHERE(在内存里做过滤)

Router组件:用于数据分发,对流入组件中的记录数据按照条件进行分发

Sq组件:

在SQ组件中,如果properties下sql query里sql的抽取条件与sql query里source filter的抽取条件冲突了,按sql query的来,source filter失效。

SQ组件中,properties下的pre sql:在mapping执行之前执行的sql

SQ组件中,properties下的post sql:在mapping执行之后执行的sql

Joiner组件:对异构数据进行关联,比如用一个文本文件和数据库表进行关联

  1. 将两个表的字段依次拖到joiner组件
  2. 在condition定义两个表的关联字段
  3. 在ports定义哪个表是master表
  4. 在properties选择join type

Lookup组件:类似于sql中的join语句,把关联找到的数据查询出来。

Lookup的ports中,‘L’为lookup要查询的字段,‘R’选项为return,为lookup查找后返回的字段,只在非关联lookup才生效。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值