数据抽取

本文档介绍了数据抽取在ETL过程中的重要性,详细讲解了DBlink和Kettle两种数据抽取工具的使用。DBlink是数据库链接,用于同种数据库间快速数据迁移,而Kettle是一款开源的ETL工具,支持多种数据源,具备定时功能。两者各有优劣,适用场景不同。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 前言

ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。本文档讲述的就是抽取的过程。
木匠要建造房屋首先要做的事情就是将森林里的树木砍伐下来,运载到自己的仓库中以备使用,这一过程实际上就是我们所说的数据抽取。伐木、运输只是一个过程,具体用什么工具和方案就由我们自己决定,数据抽取也是一样,可以用不同的方法来完成这一过程,比如dblink、kettle……当然不同的方法也有不同的优势和劣势,并不能说什么方法更好,要根据具体的业务情况来决定用什么方法。下文主要讲述了dblink和kettle。

2 DBlink

2.1 DBlink是什么

dblink(Database Link)数据库链接顾名思义就是数据库的链接 ,就像电话线一样,是一个通道,当我们要跨本地数据库,访问另外一个数据库表中的数据时,本地数据库中就必须要创建远程数据库的dblink,通过dblink本地数据库可以像访问本地数据库一样访问远程数据库表中的数据。

2.2 创建dblink

2.2.1 方法一:通过PL/SQL创建
找到对象窗口的【database links】->右键【新建】
在这里插入图片描述
按照如图所示设置:
在这里插入图片描述
设置完成点击应用
2.2.2 方法二:用sql语句
新建sql窗口,执行一下语句

create public database link dblinkNAME
  connect to userName identified 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值