Sqoop的简介
sqoop,即SQL To Hadoop
,目的是完成关系型数据库导入导出到Hadoop
Sqoop的原理是将命令翻译为mapreduce
程序执行,MR没有Reduce阶段,只有Map阶段
Sqoop的安装
-
配置环境
可以在/etc/profile
中配置,导出为全局变量或在sqoop-env.sh
文件配置
注:需提前配置HADOOP_HOME,HIVE_HOME,HBASE_HOME,ZOOKEEPER_HOME
-
将连接mysql的驱动(参考Hive数据的存储以及在centos7下进行Mysql的安装),拷贝到sqoop的lib目录
-
测试,如果没有配置环境变量,则进入sqoop安装目录下
bin/sqoop list-databases --connect jdbc:mysql://hadoop102:3306/ --username root --password 123456
导入(import)
- import 命令是从 RDMS(关系系数据库) 将数据迁移到 HDFS
导入到HDFS
\
代表在shell窗口中换行
- 命令详解:
bin/sqoop import \
// 连接的url
--connect jdbc:mysql://hadoop102:3306/mydb \
// 用户名