sqoop安装配置
#从官网下载对应的安装包上传服务器并解压到指定路径
tar -zxvf /tmp/sqoop-1.4.7.tar.gz -C /home/sqoop/
#把mysql驱动复制到sqoop的lib目录下
cp /home/hive-3.1.2/lib/mysql-connector-java-5.1.9.jar /home/sqoop/sqoop-1.4.7/lib/
#修改sqoop/conf/下的sqoop-env.sh文件
cp sqoop-env-template.sh sqoop-env.sh
vim sqoop-env.sh
export HADOOP_COMMON_HOME=/home/hadoop-3.1.3/
export HADOOP_MAPRED_HOME=/home/hadoop-3.1.3/
export HIVE_HOME=/home/hive-3.1.2
#配置环境变量
vim /etc/profile
#追加sqoop路径
export SQOOP_HOME=/home/sqoop/sqoop-1.4.7
#sqoop/conf目录下测试mysql链接
…/bin/sqoop list-databases --connect jdbc:mysql://192.168.100.26:3306/ --username hive --password 密码
mysql到hdfs脚本
数据同步及其etl
sqoop_mysql2hdfs.sh
import //使用import工具
--connect //指定连接的目标数据库
jdbc:mysql://192.168.100.111:3306/test
--username //数据库用户名
mysq_username
--pa

本文详细介绍了如何在Linux服务器上安装和配置Sqoop,包括下载、解压、驱动管理,以及环境变量设置。重点展示了使用Sqoop从MySQL数据库导入数据到HDFS,并通过ETL脚本进行层级处理和Hive表操作的过程。
最低0.47元/天 解锁文章
634

被折叠的 条评论
为什么被折叠?



