sqoop mysql to hive_使用sqoop将mysql数据导入到hive中

最新推荐文章于 2025-03-31 14:30:12 发布

原创

最新推荐文章于 2025-03-31 14:30:12 发布

· 1.4k 阅读

·

0

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#sqoop mysql to hive

本文介绍了如何使用sqoop将mysql数据库中的数据导入到hdfs，并进一步将数据加载到hive表中。首先，环境配置包括hadoop、mysql、sqoop和hive。接着，通过sqoop的import命令，选择特定字段并设置目标目录，将数据压缩并导入到hdfs。然后，在hive中创建表结构，使用load data inpath命令将hdfs数据导入hive表。最后，直接使用sqoop的hive-import功能，将mysql数据直接导入到hive表，确保所有配置正确避免执行时卡住。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先准备工具环境：hadoop2.7+mysql5.7+sqoop1.4+hive3.1

准备一张数据库表：

接下来就可以操作了。。。

一、将MySQL数据导入到hdfs

首先我测试将zhaopin表中的前100条数据导出来，只要id、jobname、salarylevel三个字段。

再Hdfs上创建目录

hadoop fs -mkdir -p /data/base　　#用于存放数据

我们cd到sqoop目录下执行命令

# \ 用于换行

bin/sqoop import\--connect jdbc:mysql://172.18.96.151:3306/zhilian \　　#连接数据库--username root \　　#用户名--password 123456\　　#密码--query 'select id, jobname, salarylevel from zhaopin where $CONDITIONS LIMIT 100'\　　#选取表的字段信息--target-dir /data/base \　　#上传到Hdfs的目录--delete-target-dir \　　#如果指定文件目录存在则先删除掉--num-mappers 1

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。