ETL工具Sqoop使用-数据共享与整合技术

本文详细介绍了如何使用ETL工具Sqoop在MySQL和HDFS之间进行数据转换。通过一系列步骤,包括启动Hadoop、Hbase、Hive、Zookeeper服务,配置和启动Sqoop服务器,创建数据库连接,以及从MySQL导入数据到HDFS,展示了Sqoop在数据共享与整合中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ETL工具Sqoop使用实验

实验目的:

  1. 掌握ETL工具Sqoop的使用
  2. 掌握MySQL和HDFS之间的数据转换

实验要求:

  1. 掌握ETL工具Sqoop的使用
  2. 能够正常操作数据库、表、数据

实验环境: 

  1. 一台独立PC或虚拟机
  2. 每台主机内存2G以上,磁盘剩余空间500M以上
  3. 已安装CentOS 7.4操作系统
  4. 已安装JDK
  5. 已完成Hadoop平台的搭建
  6. 已完成Mysql数据库平台的搭建
  7. 已完成Hbase的安装
  8. 已完成hive的安装
  9. 已完成Sqoop工具的安装

一:启动

1,在集群中所有主机上使用命令“zkServer.sh start”启动Zookeeper服务脚本,然后使用命令“zkServer.sh status”查看节点当前状态

2.在主节点使用命令“star-all.sh”启动Hadoop集群,在备用主节点使用命令“yarn-daemon.sh start resourcemanmger”启动YARN主节点服务

3.确定Hadoop集群启动之后,在主节点输入命令“start-hbase.sh”启动Hbase集群

4.进入hive的控制台并查看当前数据库列表

5.在主节点验证配置并启动Sqoop服务器

6.启动sqoop服务器,使用命令jps查看Java进程(若有名为“SqoopJettyServer”进程则表示sqoop启动成功)

进入Sqoop控制台

7.启动MySQL

二、Sqoop工具的使用

(一)MySQL->HDFS

  • MySQL集群使用root用户进行
  • Hadoop、Hbase、hive、Sqoop使用admin用户进行操作

1.初始化Sqoop服务器连接参数

2.建立MySQL测试表空间、表和数据

  1. 创建用户Sqoop并授权

  1. 创建表空间(schema)Sqoop,并创建测试表

  1. 插入测试数据

3.建立MySQL数据库连接

  1. 上传
  2. 添加工具包

  1. 创建数据库连接

  1. 建立HDFS文件系统连接

Create job -f mysql-sqoop -t HDFS-sqoop

5.在HDFS创建用于存放导出的数据文件的目录

6.创建数据传输事务

  1. ResourceManager状态查看

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值