Sqoop(1)——基本概念

本文介绍 Sqoop 工具的基本概念及其在 Hadoop 生态系统中的作用。Sqoop 是一种用于在关系型数据库与 Hadoop 之间高效传输数据的工具。文章详细解释了 Sqoop 的架构、版本差异以及其导入和导出数据的具体流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Sqoop1——基本概念

  1. 简介

Sqoop

将关系数据库(oracle、mysql、postgresql等)数据与hadoop数据进行转换的工具

 

官网:

http://sqoop.apache.org/

 

版本:(两个版本完全不兼容,sqoop1使用最多)

sqoop1:1.4.x

sqoop2:1.99.x

 

同类产品

DataX:阿里顶级数据交换工具

  1. Sqoop架构

sqoop架构非常简单,是hadoop生态系统的架构最简单的框架。

sqoop1由client端直接接入hadoop,任务通过解析生成对应的maprecue执行

  1. Sqoop导入和导出的概念

因为Sqoop是Hadoop生态系统中的一部分,所以Sqoop的导入和导出是固定的概念,从关系型数据库导出数据到HDFS成为【导入】,从HDFS导出数据到关系型数据库成为【导出】。

  1. Sqoop导入

数据流向:RDB -> HDFS

  1. Sqoop导出

数据流向:HDFS -> RDB

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值